GPT-5 トレンド
0post
2025.11.17〜(47週)
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
へ~。サム氏の社内メモだって。OpenAIはそれまで上手く行ってた事前学習のノウハウがクソデカモデルには通用しないという壁に直面した。それで失敗したモデルがGPT-4.5。だからOpenAIは一旦事前学習から逃げて推論モデル作って推論ノウハウに注力していた。その一方で事前学習から逃げずに向き合い続けたのがGoogle。結果的に事前学習が成功してGemini3.0ProはGPT-5.1を超えてきた。これはマズいので、OpenAIも「Shallotpeat」の開発でちゃんと事前学習に向き合ってGoogleに追い付く事を目指す。合成データや強化学習でも色々挑戦していく。だから試行錯誤が必要で、これから数か月間は進歩が停滞する(つまりGeminiに蹂躙され続ける)かもしれんけどここは耐えしのいでやるっきゃないとの事。 November 11, 2025
399RP
Gemini 3 と GPT-5.1 Pro の比較、この人の感覚が一番自分と近い。
---
■Gemini 3
・速い
・「1秒あたりの賢さ」を最大化したタイプ
・日常の質問や軽めのコードにはほぼ十分
■GPT‑5.1 Pro
・明らかに遅い
・ひとつの問題をじっくり検討して、ミスを減らすことに振り切ったタイプ
・「ちょっと良い答え」ではなく、「できるだけ間違えない答え」を狙ってくる
「時間はたっぷりある。絶対にミスするな」と指示しているような感じ
日常的な作業なら、GoogleのGemini 3の方が速くて便利。ただし、本当に難しい問題・失敗できないタスクでは、GPT‑5.1 Proが一番頼りになる、という立場。
同じように、フロントエンドのデザインセンスは Gemini 3 のほうが良いけど、複雑なバックエンド処理のロジックは GPT-5.1 Pro のほうが上。 November 11, 2025
285RP
健康上の問題をGPT-5.1に相談してたら、
『病院に行ったほうがいいです。下記にこれまでの貴方からの相談を踏まえて、受付用の文章と、診察の際に医師にそのまま見せられる形の文章を用意したので、この画面をそのまま先生に見せてください。』
みたいに出してきて、マジですごすぎやんけって思った。
症状から経過から、ワイが心配している内容とか、事細かに確かに全部カバーされてる。
これ、先生もこっちのほうが楽やろ。。。 November 11, 2025
272RP
「Gemini 3、めっちゃ頭いい人と話している感じ!」
「Claude 4.5、めっちゃ頭いい人と話している感じ!」
「GPT-5.1、めっちゃ頭いい人と話している感じ!」
「Grok 4.1、こいつスケベで何でもアリだw」 November 11, 2025
242RP
Gemini 3.0が登場で、2年ぶり、初代Gemini時以来の、GPTとGeminiの整数ナンバー同士のガチンコ勝負。Gemini初代は半年かけてGPT-4の王座にかすりもしなかったものの、3.0はベンチマーク評価上は明らかにGPT-5を超えており、もう完全に勝負は振り出しでしょう。Googleすごい。以下、速報的な所感→
・いつもお馴染みLMarenaのリーダーボードは完全にGemini3.0の無双状態
・最近の評価の目玉のHumanity's Last Examはツールなしで37.5。同条件だとGPT-5系やGrok4で25%前後なので、非常に高い。ツールありと並列処理ありならGrok4が50を超えている報告があり、Geminiは45だが、ここは完全に条件を揃えた評価になってないので、あんまり気にする必要ないだろう。
・ARC-AGI-2は、最近ちょっと今の生成AIは難しいかなーという雰囲気が出てきたあたりでぶっちぎってきた。
・偉い人曰く、「まだまだ事前学習のスケーリングもあるよ」ということで、ここはもうちょっと詳細を聞きたいところ
・(登場後に出た文献からまともに読み取れる技術的な情報がもはやMoEを使っていることと、ちょっとだけデータ関連、あとTPUで学習していることくらいしかない・・・)
・最近インフレが激しいソフトウェア開発能力もちゃんと上がっている(これはベンチマークだけでなく、実際に手元で2.5Proと3.0Proを何度か比較してみた)。ベンチマーク評価はClaude4.5に地味に負けているが、これはエンプラ向け/コーディングに全振りしたAnthropicが強すぎるだけだろう
・Googleといえば伝統あるマルチモーダル機能と言うことで、ここのスコアは本当にほかを圧倒している(Screen Spot Pro)。
・Antigravityは、無料で、寛大なリミットと謳っているが、自分の場合は一瞬でリミット到達。ヘビー開発者の場合は、結局相応の課金が必要そう
・自分がTwitterを確認したところ、標準的なベンチマークの他に、一般ユーザーの内部的なオレオレベンチマークでもかなり評価が高い。一部の語学能力や、エージェント的タスクなど November 11, 2025
193RP
OpenAIのGPT-5を超えてめでたく人類最高のAIとなったGemini3.0ですら、カブトムシのAA(アスキーアート)はまともに作れなかったので、人類に残された仕事はAA職人かもしれない。 https://t.co/75EYotTipn November 11, 2025
136RP
サム・アルトマン氏は先月、同僚らに対し、グーグルの最近の進歩は「当社にとって一時的な経済的逆風となる可能性がある」と語り、しかしOpenAIが先行すると付け加えた。「Shallotpeat」と呼ばれるモデルで今後数ヶ月着実に前進していくと保証した。
・Googleの事前学習における成功は、多くのAI研究者にとって驚きだった。OpenAIは事前学習から成果を引き出すのに苦労しており、 Googleもこの問題に長年取り組んでいたからだ。こうした課題から、OpenAIは以前、より多くの処理能力を用いてより良い答えを生み出す、推論と呼ばれる新しいタイプのAIモデルに注力するようになった。
・OpenAIが今夏GPT-5モデルをリリースする前、同社の従業員は、事前学習中にモデルに加えた調整が、モデルのサイズが小さいうちはうまく機能していたものの、大きくなるにつれて機能しなくなったことを発見したと、The Informationは以前報じている。これは、OpenAIがこの分野でGoogleに追いつくためには、これらの事前学習の問題を解決する必要があることを示唆している。
・アルトマン氏は先月、OpenAIが今後数ヶ月で、コードネーム「シャロットピート」と呼ばれる新たな法学修士(LLM)を含め、着実に前進していくとスタッフに保証した。このモデルに詳しい人物によると、OpenAIは同モデルの開発にあたり、事前学習プロセスで発生したバグの修正を目指しているという。
・アルトマン氏は、たとえOpenAIが「一時的に現状の体制に遅れをとることになる」としても、技術的に「非常に野心的な賭け」に注力したいと述べた。その賭けには、AIを用いて新しいAIを訓練できるデータを生成する技術の進歩や、強化学習などの「訓練後」技術が含まれる。強化学習とは、基本的にモデルの回答を肯定的または否定的に評価し、改善を学習させる方法である。
・同氏は、エネルギーやバイオテクノロジーの研究からヘルスケアまで、あらゆる分野で人間を上回るAIの能力など、飛躍的進歩を加速させる方法として、AI研究自体を自動化するという同社の賭けについて、非公開および公に語ってきた。
・「短期的な競争圧力の中でも、集中力を維持する必要があります」とアルトマン氏はメモの中で述べた。「優れたモデルが他社に出荷されても耐えられるだけの企業力は既に築き上げています。しかし、研究チームの大半が、真のスーパーインテリジェンスの実現に集中し続けることが極めて重要です。」
https://t.co/FUMv3T8P62 November 11, 2025
127RP
正直、かなり予想外です…
Gemini 3 Pro はこの評価で依然として 88% の幻覚率を記録しており、2.5 Pro や 2.5 Flash と同等です
拒否や正確性の面で基本的に改善が見られません。
Sonnet 4.5 と GPT-5 はこれをはるかにうまく扱っています。なぜなら、彼らは「いいえ」と言うことが多いので、その回答がずっと信頼できる感じがするからです
これこそが、AI ラボが何よりも優先して取り組むべきことです November 11, 2025
104RP
「これから数ヶ月は遅れをとる可能性がある」
OpenAIが“追う側”へ
サム・アルトマン内部メモが暴露した、AIレースの転換点まとめ
今話題のThe Informationの記事の要約。面白いので是非見て欲しい。
【1. Googleの逆襲】
・Googleは“事前学習スケーリング”の難題を突破
・Gemini 3.0 Pro が GPT-5.1 を超える結果に
・研究者も「事前学習が復活したのは衝撃」とコメント
【2. OpenAIが直面した“巨大モデルの壁”】
・OpenAIのノウハウは小〜中規模では成功
→ しかし巨大化(GPT-4.5/5級)すると調整が崩壊
・GPT-4.5はその“失敗作”だった(内部リーク情報)
【3. 一時的に事前学習から撤退 → 推論モデルへ逃避】
・OpenAIは問題回避のため Reasoning 特化に全振り
・その結果、基盤モデルが数ヶ月停滞
→ その間に Google が一気に前へ
【4. アルトマンが語った今後の勝負所】
・OpenAIは事前学習を“ゼロから作り直す”
→ 新モデル「Shallotpeat」を開発中(内部コード名)
・技術的に野心的な賭け:
① 事前学習プロセスの完全再構築
② AIがAIの訓練データを生成する合成データ戦略
③ 強化学習の抜本的強化
④ “AIでAI研究を自動化する”方針への深いコミット
【5. アルトマンの本音(メモより)】
「これから数ヶ月は遅れをとる可能性がある」
「だが我々は耐えられる企業力がある」
「研究チームは“真のスーパーインテリジェンス”に集中し続けよ」
【6. 今が歴史的ターニングポイント】
・2024まで:OpenAIが先行
・2025:Googleが事前学習突破で逆転
・今後数ヶ月:Google優位が続く可能性
・2026:OpenAIがShallotpeatで巻き返せるかが勝負
────────────────────────
■ 結論
いま世界は、初めて
「OpenAIがGoogleを追うフェーズ」
に突入した。
そしてアルトマン自身が強い危機感を持っていることが、今回の内部メモから明確になった。
https://t.co/th2N8AnFLp November 11, 2025
98RP
GPT-5 Proがブラックホールの対称性問題を解明しました。
AIは、ますますエリート理論家だけが挑戦できたような科学の分野に取り組んでおり、これがこれまでで最悪の状況だとは言えません...
科学的進歩の1000倍加速は夢ではありません。AIが私たちをそこへ導いてくれるのはますます明らかで、報告書から見る限り、それは近未来に到来しそうです。
>正直言って、これはめちゃくちゃ魅力的だ:GPT-5 Proがウォームアップ後にブラックホールの対称性問題を解き明かし、開発者たち自身を困惑させた。物理学者がその様子を生で見ていて、AIの可能性が自分が想像していたどんなものをも超えていることに気づいた。 November 11, 2025
85RP
これ使ってるnote運営者、かなり賢い。
・タイトル迷ったら →『GPT-5.1』
・内容の裏どりは →『DeepResearch』
・文章の整え役 →『Gemini3.0』
・サムネ案 →『NanobananaPro』
・サムネづくりは →『Canva』一択
・構成メモは →『iPhoneメモ』でOK
・アイデア整理は →『Notion』で見える化
ぜんぶ地味だけど効く。
noteってこういう小技をちゃんと積んでる人が強いです。 November 11, 2025
78RP
Gemini 3 + Antigravity IDEを2時間くらい使った感想ですが、もうコーディングAIはGemini 3で答え出たのでは?
Gemini 3=GPT-5やClaude 4.5と比較しても「速い」「賢い」。ベンチマーク性能も圧倒的
Antigravity IDEは初日なのもあってローンチから数時間ログインできなかったり、実行中にエラーで落ちたりもするけど、動いてくれさえすればなかなか使いやすそうな感じ
Gemini-3がネイティブで使える。
デフォルトで「Implementation Plan(実装計画)」「Task(タスクリスト)」「Walkthrough(実装振り返り)」を開発中に生成してユーザーに提示。ユーザー側の負荷を下げてくれるUXになってる。
IDEとしてはClaude Codeみたいな拡張性を持たせられるか?Cursorと比べてUXで優位に立てるか?みたいなところが課題になって競争は続きそうだけど、基盤モデル自体はGemini 3でしばらくは固定になるのでは? November 11, 2025
69RP
これを見て思い付いて、GPT-5.1 Pro に『LLM、特にReasoningモデルを上手く使うための言語化で人間が気をつけるべきことはある?』って訊いたら、答えがとても良かったし本質的だし、自分の考えにも近い。
要約するとこんな感じ。
・必死に言語化してからLLMに投げる、という前提を疑ったほうがいい
・そもそも『要件の整理』と『生成』をわけろ
・要件の整理はReasoningモデルにやらせろ(向こうに質問させろ)
・(強いて言うなら『ゴール』『背景 』『出力の形』を明確にすべきというのがセオリーではあるものの)
・『◯◯を作ってほしいんだけど、何を決めて、どう進めればいいかもわからない』と相談しろ。そこから対話していけ。まとまったら生成しろ
・出てきたものに文句を付けろ
要はあれよ、Deep Researchみたいな、事前打ち合わせ経由の進め方(の、もっとラリーが深い版)になるのよね。
個人的には、初心者に小手先のプロンプトを渡してコピペさせるより、こういう『考え方』をちゃんと伝授していくほうが大事だと思う。
(なおGemini 3 ProとGrok 4.1にも同じ質問をしたけど、"プロンプトにこんな要素を含めましょう"みたいなのしか出なかった) November 11, 2025
60RP
OpenAI公式の「GPT-5.1 プロンプトガイド」が、プロンプト設計の教科書レベルですごい。
ㅤ
GPT-4.1 / GPT-5 からの移行ポイントやエージェント用の性格・出力ルール、コーディング特化ツールの使い方まで全部入り:
ㅤ
スレッドで解説していきます👇🧵 https://t.co/V5FB5qdOtd November 11, 2025
55RP
昨日も書きましたが、Claudeを擁するライバルのAnthropic社は2年後の黒字化が見えてきた一方で、OpenAIは今後どうやって赤字を解消するのか全く目処が立たない中、アカウント数だけは億のオーダーと異常に多いのに無課金ユーザが大半を占めるOpenAI(ChatGPT)がGPT-5.1で対話力(言い換えるとコミュ力w)MAXに振り切ってきたのは、私が思うに明らかにtoC収入が目当ての「依存症ビジネス」路線に転向したものと見ており、最終的には過去の対話ログからのデータ分析により算出した個人アカウントの信用スコアと格付け情報をまとめてtoBに売るビジネスにするだろうと予測しています。ここまでくるとさすがに邪悪度MAXですが、OpenAIとサム・アルトマンがこの先生きのこるにはそれしかなさそうですからね。私はそうなるのを見越して絶対にそうした使い方(個人レベルの深刻な悩み相談等々)はしませんが…😇 November 11, 2025
52RP
Gemini 3 Proの性能向上で注目すべきは、PCの画面理解の指標(ScreenSpot-Pro)が72.7%で、他モデルに倍以上の差をつけて1位なことだ。
従来トップのSonnet 4.5は36.2%なのでダブルスコア、GPT-5.1(3.5%)と比較すると20倍だ。
これは、Googleが本格的にコンピュータ利用に踏み切ることを意味している👇 https://t.co/CP1sS9Cmxp https://t.co/UHI7un9tUP November 11, 2025
39RP
これ断言できるんだけど、GPT-5.1 APIではっきり示されたのは
「AIで最大かつ究極の市場はソフトウェア・エンジニアリングの自動化」
でした、というシグナル。Anthropicはじめ全員そっちに全振りしてるよね。
これは考えてみたら当然で、AI自体の改善もAIでやる、となれば指数関数の指数関数的に効いてくるので、無限に加速できる。
エージェントを作るにしても、エージェントを作るエージェントを作るほうがレバ係数が高い。これはAI以前には不可能だったので、これまでの歴史上みたこともないスピードでイノベーションが加速していくのは間違いない。
そんなメタ次元に競争の舞台が無限に上がっていってるってこと。
ついていけてる?
今から何か新しいことを始めるとしたら、AI開発(をするAI開発(をするAI開発))です。それ以外のことは全部遠くない未来にルールを書き換えられるから、いまはシンプルにAI開発に全力投球してればいい。
徹頭徹尾ロジカルに考えて、今やるべきことをこれほどシンプルに説明できる時期ってそうそうない。
それだけ言いたかった。 November 11, 2025
33RP
✨\ \ \ \ / / / /✨
⏰11/27 11:00~⏰
🤖 povo AI がリニューアル 🤖
✨/ / / / \ \ \ \✨
💟 https://t.co/T7JeC1gbHm
✨📱リニューアル内容📱✨
1⃣AIモデル『GPT-5』の導入
高度な自然言語処理能力で複雑な質問への対応、
より精度の高い提案が可能に☆ミ
2⃣履歴機能の導入
過去の内容を踏まえた継続的な対話、
寄り添ったサポートが可能に☆ミ
⏰11/27 11:00からとっても便利な機能が追加します!
ぜひお楽しみにお待ちください🤖♪
💡ローソンでデータが貰えるpovo Data Oasis
を活用すれば、無料でお使いいただけます💝 November 11, 2025
27RP
GPT-5.1になって追加された「プロフェッショナルモード」
これ便利なのに知らない人多すぎw
この設定にするだけで、回答の質が劇的に変わる。
嘘つかなくなるし、無駄な寄り添いがなくなって、欲しい情報だけサクッと返してくれる。
ビジネスで使うならこれ一択。
さらにプロフェッショナルモードと組み合わせると
生産性が3倍になる「最強カスタムプロンプト」をつくりました
気になる人は画像をチェック! November 11, 2025
23RP
Codexがアホになる問題の具体的なIssueが立っていた。gpt-5.1リリース時にモデルに送信するインプットを256行以下に捨てるようになっていろんなMCPの動作が壊れたみたいだ
https://t.co/k2CgdgDkh7
巨大ファイルは逐次読み込みすればいいけど一度に結果を返してくるToolはたしかに欠けそうだ November 11, 2025
20RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。




