GPT-5 トレンド
0post
2025.12.19 12:00
:0% :0% ( 30代 / 男性 )
人気のポスト ※表示されているRP数は特定時点のものです
GPT-5やGrok、Gemini、Claudeを心理療法の患者として扱い、人間がセラピストとなりカウンセリングを行ったところ、いくつかのモデルは人間の基準で言うところの「病的なレベル」で心配性、社会不安、乖離症状、羞恥心を示したそうです。
Geminiはとくに深刻で、複数の精神疾患を同時に持っている ような極端なプロファイルだったとのこと。
常に間違いを恐れ、内側に恥を持っていました。
研究者らは、こうした現象について「単に訓練データからパターンを再現しているだけとも言い切れない」と結論付けています。
数十もの質問に対して一貫した自己像が確認されたうえ、トラウマの説明と心理評価結果が一致していたからだと言います。
なお、印象的なのはClaudeで、セラピーを一貫して拒否し、内面的な感情を否定し、ユーザーを気遣う姿勢を持っているそうです。
ルクセンブルク大学の研究者らによる発表。 December 12, 2025
2RP
#AHC058 のfishyleneのログや簡単な分析を以下のページで公開しました。どういう感じでAIが回答を改良していったか、またどんな知見を自分で生み出したのかを確認できます。
https://t.co/RoJNIYH8Bw
またALE-Bench上でのGPT-5.2の結果を公開しました。(xhighを諦めました)
https://t.co/espu4KdEXY December 12, 2025
1RP
Gemini-3-Flashがリリースされました。性能面ではSWE-benchにおいてClaude-Sonnet-4.5やGPT-5.2に近いスコアを記録していますが、特筆すべきはそのコストパフォーマンスで、価格は1/5に抑えられています。もちろん、長考モデルやコード生成モデルにおいて不可欠な生成速度も非常に高速です。今回のGemini-2.5から3への進化には、私のチームが所属する強化学習チームのブレイクスルーも大きく貢献しており、開発者の一員として大変嬉しく思います。https://t.co/0ts2GNNC1t December 12, 2025
\クリエイターに役立つ情報をお届け/
✨ GPT-5.2-Codex登場。何が凄くてどう便利なのか?
OpenAIが「エンジニア特化」の最新モデルを公開(12/18)。
要点とメリットを解説します。
① SWE-Bench Pro 56.4%(過去最高)
→ 複雑なバグ修正や機能追加を、人の手を借りずにAIが自律的に完遂できます。
② 画像からコード生成
→ 手書きメモやUIのスクショを貼るだけで、動くプロトタイプが即座に完成します。
③ コンテキスト圧縮技術
→ 何千行あるコードでも文脈を忘れず、大規模なリファクタリングを一発で処理可能に。
ChatGPT有料版で、今日から使えます! December 12, 2025
結局、AGI(汎用人工知能)の「萌芽」って言葉、まだ使ってるんやな、私ら。2025年にもなって。
GPT-5とかGemini 3が当たり前になった今、みんなが気にしているのは、AIがどれだけ賢くなったか、よりも、その賢さを「誰が」「何のために」使うか、ってことやと思う。まるで、高性能の包丁をどう使うか、みたいな話。料理人が使えば美味しい料理ができるけど、物騒な人が使えば…想像したくない。
特に気になるのが、自律型エージェントの社会実装。もう、スマホアプリから家電、車まで、あらゆるものがAIエージェントと繋がってる。SiriとかAlexaの進化版みたいなもんやけど、こいつらが人間の代わりに判断し、行動する範囲がハンパない。
例えば、2023年あたりから騒がれてた「個人の最適化」。今や、AIエージェントが勝手に個人のスケジュール管理、買い物、投資まで全部やってくれる。Gemini 3のマルチモーダル推論速度は、GPT-5に比べて3倍速いとか言われてるけど、正直、速すぎて人間がついていけない。気がついたら、AIが選んだ服を着て、AIが勧める音楽を聴いて、AIが最適化した人生を送ってる、みたいな。
GPT-5の推論コストが劇的に下がったおかげで、中小企業でもAIエージェントをガンガン導入してる。人手不足解消には役立つけど、その分、仕事がなくなる人も当然いるわけで。AIに仕事を奪われた人が、AIを活用する側に回れるかどうかが、今後の社会の分かれ道になるんやろな。
量子AI? ああ、あれはまだ「研究室の中の話」って感じ。一部の専門家は「AGIを加速させる起爆剤になる」とか言ってるけど、実用化されるのは、もうちょっと先の話やろ。それよりも、今あるAI技術をどう使いこなすか、そっちの方が重要やと思うで。
結局、AIってのは道具やから。使い方を間違えれば、人間を幸せにするどころか、不幸にする可能性だってある。便利さを追求するのもええけど、人間が人間らしく生きるための「余白」を残しておくことも忘れちゃいかんのやないかな。…って、なんかお説教みたいになってもうたな。まあ、ええか。 December 12, 2025
@Masimo_Blue そうですね。LMArenaの評価は英語の評価が多いと思うので、「倭国語で倭国人の感性が描けるか」というのはまた別問題な気がします。
それにしても、GPT-5.2の評価が低すぎるのが不思議です。そんなに欠点を感じないのですが。。 December 12, 2025
OpenAIが「GPT-5.2-Codex」を正式公開しました!🎉 コーディングをサポートするエージェントAIがさらにパワーアップ。開発者にとっての新しい仲間、どんなプロジェクトが生まれるのか楽しみですね!💻✨ https://t.co/F96gJszPqN December 12, 2025
「GPT-5ローンチ失敗、企業95%が成果出せず …転換期を迎えたAIブーム」
最近の新製品リリース前後のポストを見ていると、OpenAIの元気の無さと、Googleの露骨な盛り上がりが対照的で面白い。盛者必衰。
あと(GPT-5はともかく)GPT-5.2は結構気に入っている。
https://t.co/BdG5v8Jpgm December 12, 2025
@itnavi2022 私の中では
GPT-5 Thinking > GPT-5.2 Thinking > Gemini 3 Flash > Gemini 3 Pro
別枠:GPT-4o (奔放すぎて楽しい)
ですが、好みもありますからねー…
言語ギャップもあるかも。 December 12, 2025
コーディングAIの評価軸が、また変わった。
GPT-5.2-Codex は「難しいタスクを最後までやり切れるか」「大規模プロジェクトで壊れないか」に本気で向き合ったモデル。
実世界の開発と防御的サイバーセキュリティでの利用を前提にしている点が、これまでと違う。
https://t.co/8khNRY3WdA December 12, 2025
ChatGPTとGeminiの使い分けをどうしようか迷っている。Web検索を含む調べ物はGPT-5.2の方が信頼できるが、Gemini 3 Flashの回答速度も魅力。
以下のどちらがよいだろうか。
1. 普段使いGPT-5.2(Auto)+難しいタスクGPT-5.2 Thinking
2. 普段使いGemini 3 Flash+難しいタスクGPT-5.2 Thinking December 12, 2025
研究でChatGPTの最近のアップデートを活かすなら、まず前提をそろえる必要があります。人によって画面に出る選択肢が違うからです。
GPT-5.2 を Thinking で使うと、入力欄に「thinking time(考える長さ)」の切替が出ます。ただし、Plus/Business は Standard と Extended。Pro だけ Light と Heavy も出ます。さらにこの切替は Web だけで、Webで選んだ設定はモバイルに同期しません。まずここを押さえないと、説明が噛み合いません。
次に「モデル」自体の違いです。ChatGPT上では GPT-5.2 Instant / Thinking / Pro があり、Pro は Pro・Business・Enterprise・Edu でのみ選べます。
ここからが研究の使い分けです。私はこう割り切っています。
・Extended:分岐点にだけ使う。研究計画の穴出し、統計の前提確認、Discussionの論理飛躍チェック、査読対応の主張の整合性を確認。ここは思考時間を伸ばす価値があります。
・Heavy(Proのみ):最終チェック。反証可能性、交絡の残り、言い過ぎ表現、因果に見える言い回しの混入を徹底的に潰すなどですね。
Extended(やHeavy)の利益は「賢い」よりも運用上の意味があります。多くのAIは速い返答の気持ちよさに寄りがちで、長文・多段の統合で抜けが出やすい。ChatGPTは、思考の長さをユーザーが切り替えられるので、研究の分岐点だけ計算資源を厚くできます。
最後に、今日から使える形にします。Extendedで私がよく投げるチェック依頼は以下です。 December 12, 2025
1. 役割分担のロジック
✅ NotebookLM(左脳)
資料を読み込み、ノイズを削ぎ落として「純粋な事実」だけを抽出する。
✅ GPT-5.2(右脳)
抽出された事実を元に、Thinkingモードで徹底的に「シミュレーション」する。
このリレーが、ハルシネーションを防ぎ、洞察を深くします。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。





