opus トレンド
0post
2025.12.12 18:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
GPT-5.2のスライド作成能力が驚異的。
ついに読み込ませたPDF論文中の図表に対して、ハルシネーションがほとんどなく画像認識 → 画像抽出 → 図表付きのpptxを出力できるようになってしまう。
Claude Opus 4.5 は、図表つきのpptxは出力できるけど、ここまで精度は良くなかったし、大量のtoken消費が課題だった。
論文の要約スライドについてはGPT-5.2がGemini 3.0 pro、nano banana、Claude Opus 4.5を超えている。
論文抄読会、どうすんだろう。
https://t.co/6O8BYxObDw December 12, 2025
3RP
canopus / POMUM
🌌💫夜空と星をイメージしたシアーネイビー
重ねるとラメに奥行きが出て、星のまたたきっぽく見えるのがあまりに良い😌
見た瞬間買わずにいられなかった……これからの寒い時期に出番が多そうで楽しみ!
写真は白いベースに三度塗り
#セルフネイル https://t.co/zXM743zyVO December 12, 2025
3RP
動画生成、ついに「全部入り」の段階へ。
Agent Opus(@AgentOpusAI)が面白いのは、単なる生成AIではなく「役割分担された複数エージェント」が裏で動く点。
調査するAI、脚本を書くAI、素材を集めるAI、編集するAIが連携し、人間の制作フローをそのまま再現している。
https://t.co/FJ8dtXYfFS December 12, 2025
2RP
OPUSからのお知らせ
12/12で10周年を迎えることができました。
ひとえに気にかけてくださる方々のおかげです。
本当にありがとうございます!
OPUS "新世界"についても、
いろいろ決まってまいりました!
ご予約は12/21(12:00)受付開始となります。 https://t.co/8M1UcojKcy December 12, 2025
2RP
【GPT5.2】絶対“ここ”を知って使ってほしい!Word・Excel・PowerPointが簡単なプロンプトで超品質生成!これはもう知識労働タスクのAIエージェント!(調整プロンプトも提示)
https://t.co/LqwNGxRcOq
#GPT52 #ChatGPT #AIエージェント #知識労働 #Word #Excel #powerpoint #ai #aiエージェント #aiツール #プロンプトエンジニアリング #プロンプト #gemini3 #gemini #claudeopus45 #Claude #ChatGPT #chatgpt5 #chatgpt5_2 December 12, 2025
OPUS10周年
おめでとうございます!
その節目に出演できること
大変嬉しくありがたやでございます。
そして、本日OPUS"新世界"の
公演情報が解禁されました。
来年2/20(金)〜2/23(月)
パレアナ倶楽部にて
ご予約は12/21(日)12:00〜受付開始です。
よろしくお願いします〜! https://t.co/fooM5T5bpt December 12, 2025
GPT-5.2出たってよ。
私「5.1、やっと慣れたのに…」
Claude「Opus 4.5出しました」
Gemini「3になりました」
私「」
AI各社、人間のことちょっと考えて?
せめて月イチにして?
…と言いつつ、全部触ってる。
(この週末も面白すぎて時間が溶ける) December 12, 2025
@sorairologic 色々同卓させていただいていて、ちょっと良かったのが多すぎて選べないですね…!
最近はグドモやレプ葬の継続行けて、長く継続で遊べているのすごく嬉しいです!
直近だとCanopusも久しぶりに2PLでたくさんお話できてすごく楽しかったです!遊園地行きましょう…! December 12, 2025
何をしたいのかにもよりますが、少し高いですが(月払いの月額3800円)唯一無二な点で個人的な推しはNotion AIです。
AIと対話したものをそのまま「記録して」って言えばメモとして保存してくれたり、日記やwebクリップや読書メモなど、さまざまな属性のデータベースを作ってくれます。
モデルも最新のGPT-5.2やClaude Opus 4.5もほぼ無制限に使えるので、それぞれの違いや特徴も一括の課金で抑えられます。
他にはPerplexityも同じように複数モデルを実質無制限レベルで使えるのと、AIブラウザ、ニュース機能がめちゃくちゃ優れています。
私はあまり使わないですが、ジェンスパークも色んなことできます。
ChatGPT、Claudeを単体で課金するのは若干コスパ悪いですが、アプリ作ったりしたいならありかもしれません。 December 12, 2025
まのでまりなさんのOPUSを鑑賞
良過ぎる…
何故こうも色彩を限定した絵が美しいのか。。
線は多くないのに、奥行きを感じる。好き。
以前キャンパスアートを購入させて頂きましたが、これは…また個展で出費が止まらないぞ。 https://t.co/2S0Rdj6RmD December 12, 2025
GPT-5.2のカットオフ日2025年8月31日らしい!!!
最新の知見にかなり強いなと感じてたけど、GPT-5.1から1年程度更新されてる!
GPT-5.1: 2024年9月
Gemini 3 Pro: 2025年1月
Opus-4.5: 2025年5月 https://t.co/DrcMyHUxN1 December 12, 2025
【OPUS 2026年2月20日〜23日】
12/21 12:00 予約受付を開始します
10周年ありがとうございます
そして、ひと区切り… https://t.co/dZjGlP1zuO December 12, 2025
後からもうちょっと詳しく見てみますが、GPT-5.2、評価スコアや使用感的には、本来対抗を意識したGoogleのGemini3.0よりは、AnthropicのClaude 4.5 Opusに直撃しそう
Claudeはコーディング、エンプラ特化路線をとっているので、非特化のGPTに迫られるor超えられる状況が続くと、存在意義が怪しくなる。 https://t.co/EWzOGAbLfp December 12, 2025
openai 发布了gpt5.2
巨大的能力提升,再次证明scaling law前面没有墙,ai经济没有泡沫。
个人认为最好的评论是下面这一篇(节选):
“一年前,在 ARC-AGI-1 上达到 88% 准确率,估计每任务成本约 4500 美元。今天达到 90.5%,只需 11.64 美元。
12 个月内成本降低了 390 倍。看看那个排行榜。效率前沿几乎每几周就被重画一次。
GPT-5.2 Pro、Grok 4、Gemini 3 Deep Think、Claude Opus 4.5,全都沿着从左下到右上的对角线层层叠加,每一个新模型都让前任的性价比瞬间过时。
大多数人还没搞懂这个基准的意义有多大。
François Chollet 在 2019 年专门设计了 ARC-AGI,就是为了对抗暴力堆算力的路子。他的核心论点是:大语言模型只会死记硬背训练数据,遇到全新抽象推理任务会彻底崩盘。
所以测试的每道题都是独一无二的、网上从未在网上出现过的,需要从极少样本中真正泛化。人类轻松做到 95%。多年来,最强的 AI 系统连 5% 都摸不到。
2020 年 Kaggle 比赛最高才 20%。到 2023 年也才 33%。GPT-3 直接提示得分 0%。AI 研究圈基本接受了“ARC-AGI 证明单纯 scaling 走不通”的结论,Chollet 本人说达到人类水平“还得很多年”。
然后 2024 年 12 月,OpenAI 的 o3-preview 在高算力模式下干到 87.5%,首次突破人类基准线 85%。但模型每道题要尝试 1024 次,每次写出大约 137 页推理,成本估算在 3000~30000 美元/任务不等。
仅仅 11 个月后,GPT-5.2 Pro 以 90.5% 准确率、11.64 美元/任务的价格出现。
这波成本崩盘的数字说明了一切。。。我们在过去几个月里悄悄跨过了“AI 推理比人类便宜”的那条线,大部分人都没注意到。
效率提升完全没有减速,反而在复利式增长。
ARC-AGI-1 彻底沦陷之后会怎样?Chollet 已经在 2025 年 3 月放出了 ARC-AGI-2,专为当前推理系统设计得更难。
人类依然接近 100%,当前前沿模型只有 10-45%。但即使在这个更难的基准上,人与 AI 的差距也已经从“根本能力鸿沟”变成了“成本优化问题”。
那个原本要证明 AI 无法泛化的基准。。。ai一年实现了 390 倍效率提升。” December 12, 2025
AI 駆動開発勉強会 フロントエンド支部 #1 w/あずもば で学んだことを共有します!
LLM に現在のUI を理解させる方法
Simulator / Emulator / 実機のスクショを撮る
スクショを LLM の入力欄に渡す
Base64 encode され、LLM が内容を理解できる
ただ、この方法は面倒なので、自動化が重要になる。
シュミレーターのスクリーンショットについて
IOS の場合はsimctl を使うと、スクリーンショットを撮れる。
Android であれば、adb コマンドを使えばスクリーンショットを撮れる。またUI ツリーを取得し、LLM が UI操作を行い、任意の画面操作が可能にもなる。
Design System とは?
プロダクトやサービスのUI を一貫性を持って効率的に構築するための「ルール・コンポーネント・ガイドライン」をまとめた体系
Design System を活用してる現場の現状
ほとんどの UI はDesign System を活用することで実装できる。
ただ、DogFooding などで問題や指摘が上がり改善する必要が….
既存のバグで特定の条件の時にUI が表示されるなど、対応が難しくなっていく…
Microsoft Ignite とは?
Microsoft の クラウド・AI 戦略がすべて分かる、最大級のエンタープライズ向け技術イベント
MicroSoft Build が開発者寄りなのに対し、Ignite は IT / クラウド基盤・AI のエンタープライズ活用 が中心
MIcrosoft Ignite 2025 キーノートについて
「可観測性」 をスタック全体で確立する、というテーマ
現在、AIエージェントを観測できない・ガバナンスできない・安全性が担保できない、といった課題が顕在化してるため、上記のテーマになった。
AI フレンドリーな設計原則
1宣言的設計
2関数型パラダイム
3イミュータブル
4型システム
5セオリー準拠
6系の明確化
Devinを使っていると、どれだけ CI を高速化できるか?が重要になる。
実行のスピードが遅いと、AI が失敗に気づくまでの時間がかかるので、ここが重要。
CI 高速化のための3つのコツ
- Integration Test の高速化を行う
- フィードバックの速度
- AI の実装ミスを 即座に検出
フロントエンド開発時、テストしやすい設計を行う
- Container のテスト
- 検証項目: 「この条件のときにこういうデータを渡すか?」
- 手法:MSW などでAPI をモックし、ビジネスロジックだけ検証
- Presenter (UI) のテスト
- 検証項目: 「特定のProps を渡した時に、こう描画されるか?」
- 手法 Storybook や スナップショットテストで機械的に確認
Ray-Ban Metaの登場で、理由があって着用するデバイスから、理由なく着用するデバイスへ変わった
Apple Watch や AirPods のようなファッションになる。
AIグラス・スマートグラスはスマホを置き換えるのか?
Meta Ray-Ban Displayを使えば、
SNS や 地図、通話など、見る・話すことはグラスで代替可能。
その上で、腕時計デバイスと一緒に使うと、ある程度代替可能になる。
XR アプリ開発の変化
Unity や Unreal Engine の開発は、初心者には難しかった。
これからは、ネイティブ言語でも作成できるので、開発が簡単になっていく。
仕様からネイティブ環境で 生成AI がプラットフォームごとに生成出来るようになる。
Microsoft Foundry(旧称 Azure AI Foundry)とは?
モデル選定、エージェント・ワークフロー構築、デプロイ、監視・評価までを一気通貫で扱える「AI アプリ/AI エージェント用の基盤サービス」のこと
音声から言葉を伝えると、色々と可能性が広がる。
XR デバイスは、音声のノイズが少ない
すぐに音声をデバイスに渡せるため
最近の 音声技術について
- クラウド環境で制御できて、使うモデルをどんどん入れて試せる
- 情報の取り扱いに関しては、自分で使われるところのデータ追跡性も高い
- 最近は API が作られているので、扱いやすくて簡単に利用できる。
VsCode の Copilot 拡張 は、OSS 化していて、コードを読むことができる
MCP Client としての Copilot 拡張の実装
MCP Client としての Copilot 拡張でのMCP Tool 選択の実装
GitHub Copilot Chat agent mode の ツール上限は128 個
どのように、ツール選択の精度を高めているか?
ユーザーの入力をベクトル化して、それに合ったツールを選択している。
ツールが増えすぎると、「仮想ツール」でツールをグループ化している64個以上 の時に、仮想ツール化が起こる。
仮想化ツールの仕組み
MCP Tool Name と MCP Tool Description をベクトル化して、意味合いが近いものをグループ化する。
その後、グループを情報を要約してDescripitonに追加する。
結果、利用するツール数を少なくしている。
Open Tabの機能について
開いているタブで同じLanguage id の内容を参照として入れている。
また、別言語のファイルは、コンテキストに入れてない様子。
Figma デザインから、アプリケーションを作成できる
Codex × SwiftUI で CodeToDesign アプローチを行える
スナップショット取得→修正の自動化手順
1. プロジェクトへ画像配置
2. カレントディレクトリ移動
3. Codex に プロンプト入力を基 に Swift UI を作成させる
4. 生成コードを確認・調整・必要に応じて再生成・修正
5, ContentView.swift に組み込み・表示確認・調整させる
GitHub Copilot for Xcode も、色々なモデルが利用可能
GPT-5.1 と Claude Opus 4.5 も利用できる。
一つのチャット内で、モデルを切り替えられる。
GitHub Copilot for Xcode が上手く動かない場合の対応方法 Xcode 自体の再起動を行う。
その上で、GitHub Copilot for Xcodeも再起動するといい。
GitHub Copilot for Xcodeの最新機能を利用したい場合は、直接GitHubからダウンロードする
HomeBrewだと、古いバージョンしか利用できない。
今日も、とても沢山のことを学ばせて頂きました。
主催いただいた 、AI 駆動開発勉強会 さん、あずもば さん、スポンサーの方々、ご登壇者の方々、ありがとうございました! December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



