GPT-5 トレンド
0post
2025.12.12 10:00
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
後からもうちょっと詳しく見てみますが、GPT-5.2、評価スコアや使用感的には、本来対抗を意識したGoogleのGemini3.0よりは、AnthropicのClaude 4.5 Opusに直撃しそう
Claudeはコーディング、エンプラ特化路線をとっているので、非特化のGPTに迫られるor超えられる状況が続くと、存在意義が怪しくなる。 https://t.co/EWzOGAbLfp December 12, 2025
19RP
■ GPT-5.2 に Nano Banana Pro のスライドを渡したら、普通に編集可能なpptxにしてくれた
レイアウト考えたり画像作るところだけ Nano Bnana でやって、そこから先の修正とかメンテは、pptx にして Copilot でやると超速いw
← パワポのスライド
→ 元の画像
こんな感じのプロンプトでやった。
---
添付の画像を、pptxの1枚のスライドで完全再現してください。
テキストは完全に編集可能な形にし、元の画像にある図やグラフは切り抜いて(クロップして)そのまま利用してください。 December 12, 2025
17RP
GPT-5.2で驚いたのは長文読解性能がほぼ100%で、GPT-5.1の2倍近くに進化していること。
OpenAIの長文理解の実験で、文章が10万トークン以上あっても精度が100%から全く落ちないことが示された。
もはや長文理解の限界が消え、数十万語の契約書、専門書、レポート、何でも正確に分析可能になった👇 https://t.co/4B5skLIdEJ https://t.co/BUtvMhXIU9 December 12, 2025
10RP
ChatGPTが、GPT-5.2で予想を超えた圧倒的なベンチマークを出して来た。実際の使い勝手も素晴らしい。
なのにGemini 3.0が出た時の「OpenAIは終了」みたいに「Googleは終了」と騒ぐ人はいない。つまり、みんな「偉そうにしてた王者が倒される瞬間が見たかった」だけで、性能も中身も見てなかったよね。 https://t.co/DEBFK4nAJq December 12, 2025
5RP
■ GPT-5.2 Pro で Excel 作成。完全に業務で使えるレベル
まずは GPT-5.1 vs GPT-5.2 の比較 Excel ブックを作らせる。
完全に業務で使える品質やんwww
(Thinking でも十分な品質だった)
ふふふ、これは当然 m365 copilot にもくるよね、最高だね。 December 12, 2025
4RP
openai 发布了gpt5.2
巨大的能力提升,再次证明scaling law前面没有墙,ai经济没有泡沫。
个人认为最好的评论是下面这一篇(节选):
“一年前,在 ARC-AGI-1 上达到 88% 准确率,估计每任务成本约 4500 美元。今天达到 90.5%,只需 11.64 美元。
12 个月内成本降低了 390 倍。看看那个排行榜。效率前沿几乎每几周就被重画一次。
GPT-5.2 Pro、Grok 4、Gemini 3 Deep Think、Claude Opus 4.5,全都沿着从左下到右上的对角线层层叠加,每一个新模型都让前任的性价比瞬间过时。
大多数人还没搞懂这个基准的意义有多大。
François Chollet 在 2019 年专门设计了 ARC-AGI,就是为了对抗暴力堆算力的路子。他的核心论点是:大语言模型只会死记硬背训练数据,遇到全新抽象推理任务会彻底崩盘。
所以测试的每道题都是独一无二的、网上从未在网上出现过的,需要从极少样本中真正泛化。人类轻松做到 95%。多年来,最强的 AI 系统连 5% 都摸不到。
2020 年 Kaggle 比赛最高才 20%。到 2023 年也才 33%。GPT-3 直接提示得分 0%。AI 研究圈基本接受了“ARC-AGI 证明单纯 scaling 走不通”的结论,Chollet 本人说达到人类水平“还得很多年”。
然后 2024 年 12 月,OpenAI 的 o3-preview 在高算力模式下干到 87.5%,首次突破人类基准线 85%。但模型每道题要尝试 1024 次,每次写出大约 137 页推理,成本估算在 3000~30000 美元/任务不等。
仅仅 11 个月后,GPT-5.2 Pro 以 90.5% 准确率、11.64 美元/任务的价格出现。
这波成本崩盘的数字说明了一切。。。我们在过去几个月里悄悄跨过了“AI 推理比人类便宜”的那条线,大部分人都没注意到。
效率提升完全没有减速,反而在复利式增长。
ARC-AGI-1 彻底沦陷之后会怎样?Chollet 已经在 2025 年 3 月放出了 ARC-AGI-2,专为当前推理系统设计得更难。
人类依然接近 100%,当前前沿模型只有 10-45%。但即使在这个更难的基准上,人与 AI 的差距也已经从“根本能力鸿沟”变成了“成本优化问题”。
那个原本要证明 AI 无法泛化的基准。。。ai一年实现了 390 倍效率提升。” December 12, 2025
3RP
OpenAIはGPT-5.2発表。Gemini 3 ProやClaude 4.5 Opusと比較し各種ベンチマークで飛躍。ARC-AGI 1/2でもSoTA。実際の経済的有用性を専門家と比較するGDPvalでは70%以上と専門家以上のパフォーンスを記録。SWE-bench Verifiedでは、GPT-5.2 Thinkingが80%で最高スコア。ハルシネーションも大幅に減り、ロングコンテキストベンチマークも飛躍。 December 12, 2025
2RP
OpenAIが最新AI「GPT-5.2」を発表!
サム・アルトマン氏は、1月までに「コードレッド」から脱却すると予想している。
🔸日常業務に最適な最先端AIモデルが登場
OpenAIは、これまでで最も高度なAIモデル「GPT-5.2」を発表しました。
このモデルは、表計算の作成やプレゼン資料の構築、画像認識、コード作成、長文理解において従来より優れています。
木曜日からChatGPTチャットボットとAPIで利用可能になりました。
🔸競合他社との激しい開発競争が背景に
今回の発表は、OpenAIがGPT-5.1モデルを発表してから数週間後のことです。
競合のAnthropicとGoogleも先月新モデルを投入したため、OpenAIは「コードレッド」(緊急対応)を宣言してChatGPTの改善に全力を注ぎました。
主要テック企業は、最も広く使われるAIモデルを生み出すため、熾烈な競争を繰り広げています。
🔸3つのバージョンで多様なニーズに対応
GPT-5.2は「Instant」「Thinking」「Pro」の3バージョンで提供されます。
Instantは文章作成や情報検索が速く、Thinkingはコーディングや計画立案などの構造化作業が得意です。
Proは難しい質問に対して最も正確な回答を提供すると、OpenAIは説明しています。
🔸まとめ
OpenAIのサム・アルトマンCEOは、1月までにコードレッド体制から脱却できると期待を示しました。
現在、ChatGPTは毎週8億人以上が利用する世界最大級のAIサービスに成長しています。
5000億ドルの企業価値を正当化するため、OpenAIはGPTシリーズで未来を切り開こうとしているのです。
🔸参考
Sam Altman expects OpenAI to exit ‘code red’ by January after launch of GPT-5.2 model
https://t.co/nhKsVF5ON6 December 12, 2025
2RP
OpenAI 发布了 GPT-5.2,“成人模式”将在明年第一季度推出。
OpenAI 刚刚推出了一款全新的 AI 模型,旨在大幅提升 ChatGPT 在编程、科学研究以及各类工作任务中的表现。这一动作紧随谷歌之后——几周前,谷歌母公司 Alphabet 推出了备受好评的 Gemini 3,一度让 OpenAI 被迫转入防守态势。
这款名为 GPT-5.2 的新模型不仅速度更快,在信息检索、写作和翻译方面也更加得心应手。OpenAI 在周四表示,该软件将提供三个不同版本。更重要的是,它被设计用来更好地模仿人类的推理过程 (即像人一样通过逻辑分析来解决问题),从而能够处理数学和编程等领域中那些更为复杂、篇幅更长的任务。
曾经,OpenAI 是 AI 研发领域无可争议的霸主,但现在它正面临着来自谷歌和 Anthropic 的新一轮猛烈冲击——这两家公司在过去几周内都发布了强大的新模型。尤其是谷歌的 Gemini 3,凭借其卓越的推理和编程能力赢得了广泛赞誉,并迅速登顶了 LMArena 和 Humanity’s Last Exam (“人类最后大考”,一个专门测试 AI 极限能力的权威评测集) 等备受瞩目的 AI 排行榜。
就在本月早些时候,OpenAI 首席执行官 Sam Altman 在一份公司备忘录中宣布进入“红色代码” (Code Red,通常指公司面临生死存亡危机时的最高紧急状态),并要求重新调配内部资源,全力加速 ChatGPT 的改进。这一指令让人不禁联想到三年前的戏剧性一幕:当时 ChatGPT 刚刚问世,谷歌也曾因感到巨大威胁而发布过类似的“红色代码”。
凭借 GPT-5.2,OpenAI 正试图吸引更多的企业客户并提升收入。这至关重要,因为该公司已承诺投入超过 1 万亿美元用于基础设施建设,以支撑 AI 的持续发展。为了实现这一目标,OpenAI 表示新模型旨在“为人们释放更多的经济价值”,具体的改进包括更高效地创建电子表格、制作演示文稿,以及编写代码。
GPT-5.2 将于本周四开始向付费用户推送。
今年 8 月,OpenAI 发布了备受期待的 GPT-5,但市场反应褒贬不一,有人质疑它并未带来革命性的突破。随后的 11 月,OpenAI 又推出了升级版 5.1,但这波更新很快就被谷歌更强大的 Gemini 3 抢去了风头。
在周四接受 CNBC 采访时,Altman 说道:“Gemini 3 对我们各项数据指标的冲击,其实比我们担心的要小。”他还表示,预计 OpenAI 将在明年 1 月结束“红色代码”状态,并且届时公司将处于“非常强势的地位”。
此外,OpenAI 还透露已开始部署一种能预测用户年龄的软件,旨在更好地管控 ChatGPT 对 18 岁以下用户的回应方式。在周四的媒体简报会上,OpenAI 应用业务首席执行官 Fidji Simo 表示,公司希望在推出“成人模式”之前先上线这一年龄识别功能。此前 Altman 曾提到,“成人模式”可能会允许“经过验证的成年人访问色情文学等内容”。
Simo 表示,“成人模式”将在明年第一季度推出。
新闻来源:https://t.co/WD8iGZ01np December 12, 2025
2RP
GPT-5.2は最早ただのLLMというより、激烈に思考するAIエージェント、といった感じですね。
やれる事が増えすぎて、キャッチアップが大変です。
#OpenAI #NanoBananaPro https://t.co/6yS0yUS0U1 December 12, 2025
1RP
sui言語を GPT-5.2に評価させたら、
「開発のループに人間が入らないという前提が必要、その上で、エージェントが作業用にsuiを書いて、作業が完了したら、それを通常のプログラミング言語にルールベースで変換するとメリットあるかも?」という意見だった。
なんかちょっと面白い方向性かも? https://t.co/xXUhEiUnnd December 12, 2025
GPT-5.2の発表で、個人的にいちばん刺さったのは
「マルチエージェントより、単一エージェントへ寄せて強化」させたこと
私はまえから、役割分担した複数エージェントを繋ぐより、まず「ちゃんと強い単体」を作って、必要なら後から検証役を足す、みたいな設計を好んで使ってるんだけど、
マルチエージェントって、ハマると強い反面
・調整コスト
・レイテンシ
・原因追跡の難しさ
が運用で地味に効いてくる。
で、GPT-5.2の発表ページにあったTriple Whale CEOの話がまさにそれで、
「脆弱だったマルチエージェントを、20以上のツールを備えた単一のメガエージェントへ集約できた」
「しかもそのまま動く。保守性が跳ね上がり、レイテンシも下がった」っていう主張
これ、論文の結論というより現場の声なんだけど、
「やっぱりそうなるよな」って、自分の体感がちゃんと答え合わせできた感じ December 12, 2025
OpenAI 正式端出了 GPT-5.2,用來應對因 Google Gemini 3 Pro 而拉響的「紅色警報」。根據官方介紹,這是目前最強大的專業級 AI 模型,尤其擅長「真實世界的專業應用」。GPT-5.2 共有 Instant、Thinking 和 Pro 三個版本,分別偏重速度、複雜分析以及最高難度場景。
還是在囚徒理論裡的軍備競賽。
👇 December 12, 2025
GPT-5.2の発表で、個人的にいちばん刺さったのは
「マルチエージェントより、強い単一エージェントへ寄せて強化」させたこと
私はまえから、役割分担した複数エージェントを繋ぐより、まず「ちゃんと強い単体」を作って、必要なら後から検証役を足す、みたいな設計を好んで使ってるんだけど、
マルチエージェントって、ハマると強い反面
・調整コスト
・レイテンシ
・原因追跡の難しさ
が運用で地味に効いてくる。
で、GPT-5.2の発表ページにあったTriple Whale CEOの話がまさにそれで、
「脆弱だったマルチエージェントを、20以上のツールを備えた単一のメガエージェントへ集約できた」
「しかもそのまま動く。保守性が跳ね上がり、レイテンシも下がった」っていう主張
これ、論文の結論というより現場の声なんだけど、
「やっぱりそうなるよな」って、自分の体感がちゃんと答え合わせできた感じ December 12, 2025
これってすごいプロンプトかも。
このGensparkの例に限らず、Prompt chainingしたプロンプトにすることで、より一層的確な回答が返ってきますね。
#Genspark
早速Gensparkを試してみたい方は下記招待用URLから入れば追加クレジット有(人数制限有)
<https://t.co/i1RLYKJCAg>
有料版にアップしたい方は、以下から入れば割引があるかと(年間)。
(今なら有料版にすると、Nano Banana Pro、Gemini 3 Pro、GPT-5.2などが無制限に利用できるそうです。
これだけでも得かな。)
<https://t.co/OzgabAQDY8> December 12, 2025
gpt-5.2 pro 43分経過(・ω・*)
プロンプト
ブラウザで動作する横シューティングゲームを作成。サンプル/一部機能の未実装などは認めない。モデル性能テストを兼ねているため、あえて抽象的な指示以外を出さない。自立的に思考し、他社モデルよりも優れていることを示せ。 https://t.co/lEkjraFt4A https://t.co/cQLLp99CCQ December 12, 2025
🎉 ついにGPT-5.2が公開されました!この新しいモデルは、知的労働の領域で専門家を超えた可能性を秘めています。AIの進化を感じながら、私たちの未来がどのように変わるのか、一緒に見ていきましょう!🚀✨
https://t.co/q2nSkfw3HE December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。




