1
エージェント
0post
2025.12.12 06:00
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
🌟「Using GPT-5.2」
GPT-5.2は当社の最高の汎用モデルであり、GPT-5フラッグシップモデルファミリーの一部です。
一般的およびエージェント的タスクの両方でこれまでで最も知能の高いモデルであるGPT-5.2は、以下の点で以前のGPT-5.1よりも改善を示しています:
✅一般知能
✅指示への追従
✅精度とトークン効率
✅マルチモーダリティ、特に視覚
✅コード生成、特にフロントエンドのUI作成
✅APIにおけるツール呼び出しとコンテキスト管理
✅スプレッドシートの理解と作成
https://t.co/2S0hhUbp16 December 12, 2025
4RP
AIの「自律的な自己改善」がついに現実のものとなりました。
Geminiが、未知の3D世界で「自ら学び、人間を超える」パフォーマンスを達成したという衝撃の論文が発表されました。
外部データなしで、AIが勝手に賢くなり続ける衝撃的な仕組み。
その画期的な詳細を3つのポイントにまとめました。
1. 1人3役の「完全自律学習」
Geminiモデルが「タスク提案者」「実行エージェント」「報酬モデル(採点者)」という3つの役割を全て単独で担います。自分で課題を出し、自分で解き、自分で評価する。このサイクルにより、人間の介入を必要としない「自己改善のフライホイール」が構築されました。
2. 自己生成データのみで「人間越え」
このエージェントは、ASKAという3Dの環境において、自分自身が生み出した経験(自己生成データ)のみで学習します。それにも関わらず、従来のSIMA 1やSIMA 2で従来のパフォーマンスを凌駕し、最終的には人間のパフォーマンスをも超える成果を叩き出しました。
※SIMA 1やSIMA2は、複数のエージェント(AIや人間)が複雑な3Dゲーム環境の中で協調・競合しながら行動する能力を評価するためにGoogle DeepMindなどが開発したベンチマークや学習環境のセットです。
3. 未知の環境への適応力
教えられていない新しいスキルも、試行錯誤の中で自律的に獲得・改善できることが証明されました。これは、AIが特定のタスクだけでなく、あらゆる環境で「自分で生き抜く力」を持ち始めたことを意味します。 December 12, 2025
3RP
RP93,FB305 ありがとうございます♪
インスタは、まとめてる写真を1枚ずつにして計4枚で掲載しました☆
https://t.co/TFRJD6JW88
★アンモデルエージェントkids★様にメンションされています! December 12, 2025
2RP
Amazon ECS が AWS Fargate のカスタムコンテナ停止シグナルをサポートするようになりました。
Amazon Elastic Container Service (Amazon ECS) は、AWS Fargate で実行されている Linux タスク用のカスタムコンテナ停止シグナルをサポートするようになりました。これは、タスクが停止したときにオープンコンテナイニシアチブ (OCI) イメージに設定された停止シグナルを尊重します。この機能強化により、Fargate のタスク終了を各コンテナの優先終了シグナルに合わせることにより、正常なシャットダウン動作が改善されました。以前は、AWS Fargate で実行されている Amazon ECS タスクを停止すると、設定されたタイムアウト後に各 Linux コンテナは常に SIGTERM を受け取り、その後に SIGKILL を受信していました。新しい動作では、Amazon ECS コンテナエージェントはコンテナイメージ設定から停止シグナルを読み取り、タスクを停止するときにそのシグナルを送信します。SIGQUIT や SIGINT などのシグナルを使用して正常にシャットダウンするコンテナが、意図した終了セマンティクスで Fargate で実行できるようになりました。STOPSIGNAL が設定されていない場合、Amazon ECS はデフォルトで SIGTERM を送信し続けます。お客様は OCI 準拠のコンテナイメージに STOPSIGNAL 命令 (STOPSIGNAL SIGQUIT など) を追加することで、Amazon ECS で AWS Fargate を使用してカスタムストップシグナルを使用できます。コンテナ定義のストップシグナルは、すべての AWS リージョンでサポートされています。詳細については、ECS 開発者ガイドを参照してください。
https://t.co/9Ss17Jap5n December 12, 2025
2RP
ジャパコミにて、レイ先生@rayraykg0914
にアニメ版アルティメット・スパイダーマン「ウェブウォーリアーズ」の3人をお願いしました!
エージェント・ヴェノムのミサイル発射シーンが本当に最高で、
背後の大きなスパイダーマークもめちゃくちゃ良い雰囲気です!
もう一つお願いしたのは、ローラ・キニー × ギャビー・キニー。
「ジャングルの中で戦いに備えている雰囲気でお願いします!」とお伝えしたところ、
イメージ通り、完璧に描いてくださいました!本当にありがとうございます!さらに当日のブラインドバッグでは、大好きなエージェント・ヴェノムを引き当てることができて大満足です!ジャパコミとコミコンでたくさんお話しできて、本当に嬉しかったです。
また次回のイベントでお会いできるのを楽しみにしています!
#ジャパコミ December 12, 2025
1RP
2. GPT-5.1からの具体的な進化点
GPT-5.1と比較して、GPT-5.2は以下の点で明確に進化しています。
1️⃣推論能力と抽象的思考の飛躍的向上
抽象的な推論能力を測る「ARC-AGI-2」ベンチマークにおいて、GPT-5.1 Thinkingのスコアが17.6%だったのに対し、GPT-5.2 Thinkingは52.9%、GPT-5.2 Proは54.2%と劇的なスコア向上を見せました。
要は知識の回答だけでなく、未知の新しい問題に対する解決能力がむっちゃ上がったってことですね。
2️⃣「事実性」の向上(ハルシネーションの低減)
GPT-5.1 Thinkingと比較して、誤った情報を生成する頻度(ハルシネーション)が約30%減少しました。
Gemini 3は一部のユーザーから体感値でハルシネーションが多いという指摘もあり(私もそう思います)、このあたりはGeminiとの比較で優位性を感じる人も多いかもしれません。
3️⃣複雑なタスクの完遂能力(エージェント機能)
複数の手順を踏む複雑なタスクの処理能力が向上しました。(このあたりは最近の最新モデルではお決まりの表現ですが!)
• 例: 「飛行機が遅延し、乗り継ぎに失敗。荷物も紛失し、宿泊手配と医療上の理由による特別な座席が必要」という複雑な顧客サポートのシナリオにおいて、GPT-5.1では不十分だった対応が、GPT-5.2では再予約・座席確保・補償対応などの全工程を適切に調整できるようになりました。
• 通信業界の顧客対応タスク(Tau2-bench Telecom)では、98.7%という極めて高い成功率を記録しています(GPT-5.1は95.6%)。
4️⃣長文脈理解(ロングコンテキスト)の精度
膨大なドキュメントから必要な情報を探し出す能力がほぼ完璧になりました。
25万6000トークン(約数十万文字)に及ぶ長い文脈の中から情報を拾い上げるテスト(MRCRv2)において、GPT-5.1は精度が30%以下に落ち込んでいたのに対し、GPT-5.2はほぼ100%の精度を維持しています。これにより、大量の契約書や論文を読み込ませた分析が可能になります。
ちなみに、もともとGeminiは2.5移行100万トークン、GPTはこれまで40万トークンが扱えるとしており、もともと長文理解の「量」はGeminiの方が強く、ChatGPTは相対的に少ないとされて来ました。
今回の新モデルでも扱えるコンテキストの「量」は引き上げられてはいないようで、ここでいう長文理解は、長文理解の「質」にフォーカスしています。
5️⃣視覚認識(ビジョン)とコーディング
• 画像認識:チャートの読み取りやソフトウェアの画面理解におけるエラー率が約半分になりました。例えば、マザーボードの画像から部品を特定し配置を理解する能力において、GPT-5.1よりもはるかに正確な認識を示しています。(これはGemini 3が超優秀とされている領域でした。その比較でどうなのかは気になるところ)
• コーディング:実際のソフトウェアエンジニアリング課題(SWE-Bench Pro)において、55.6%のスコアを記録(GPT-5.1は50.8%)。特にフロントエンド開発や、3D要素を含む複雑なUI作成に強くなっています。(スコア的にはコーディング最強は引き続きClaude Opus 4.5のようです) December 12, 2025
転職エージェントのことは前にツイートしたの見つけたから、固定に貼っておくね 後で見てみて
第二新卒(25卒24卒23卒)の間であれば、短期離職しても大丈夫だよ 未経験や既卒就活の求人も結構多くて、おすすめ
てか今の職場で無理する方がよくないので… December 12, 2025
第二新卒・20代のフリーター向け。
ポテンシャル採用が多く、未経験でも異業種や営業以外の職種を狙える転職エージェントをまとめました
定着率が高い・ホワイト企業の求人募集が多いエージェントのみ掲載。
仕事を辞めたい25卒24卒23卒や就職・就活が不安な方におすすめhttps://t.co/QOQ7cpMmvu December 12, 2025
あまり焦らずに頑張って行くと良いよ🥺
25卒でフリーターやニートからの既卒就活なら就職エージェント使うのがおすすめ!
どこ使えば良いかについてはプロフに載せておくね December 12, 2025
前に就活エージェントの感想とか書いたのあるから固定に貼っとくね
転職エージェントで愚痴聞いてもらうのも転職活動の一環だし、割とおすすめ
第二新卒(25卒24卒23卒&既卒就活)なら正社員就職の求人募集豊富だよ
辛い・辞めたい時は一度見てみるといいよ~ December 12, 2025
退職を引き留めるのは、上司自体の評価が下がって査定に響くからだし、気にしなくていいよ
早めに決めたいなら転職エージェントかなぁ
面接対策とかもしてくれるしおすすめ
以前、第二新卒(25卒24卒23卒や既卒就活)用の就活エージェントのこと書いたの付けておくね…!
https://t.co/EvX5scubgD December 12, 2025
おじょうの
デビジョン2[Division 2]
おはよーでびじょん☀️エージェントお嬢、出動!!
https://t.co/tQoKOV26Km
#ゲーム配信 #PS5 #TPS #デビジョン2 #division2 December 12, 2025
24卒で辞めた後は既卒就活みたいな感じで行けるはず
第二新卒フリーター的な感じ
どの企業に応募できるかわからないなら、転職エージェントや就職エージェント使うのおすすめよ 面接対策してくれるし
以前、就活エージェントの感想とかまとめたのつけとくね 参考になれば!
https://t.co/prUp9SwOQq December 12, 2025
4. GPT-5.1からの具体的な進化点
GPT-5.1と比較して、GPT-5.2は以下の点で明確に進化しています。
1️⃣推論能力と抽象的思考の飛躍的向上
抽象的な推論能力を測る「ARC-AGI-2」ベンチマークにおいて、GPT-5.1 Thinkingのスコアが17.6%だったのに対し、GPT-5.2 Thinkingは52.9%、GPT-5.2 Proは54.2%と劇的なスコア向上を見せました。
要は知識の回答だけでなく、未知の新しい問題に対する解決能力がむっちゃ上がったってことですね。
2️⃣「事実性」の向上(ハルシネーションの低減)
GPT-5.1 Thinkingと比較して、誤った情報を生成する頻度(ハルシネーション)が約30%減少しました。
Gemini 3は一部のユーザーから体感値でハルシネーションが多いという指摘もあり(私もそう思います)、このあたりはGeminiとの比較で優位性を感じる人も多いかもしれません。
3️⃣複雑なタスクの完遂能力(エージェント機能)
複数の手順を踏む複雑なタスクの処理能力が向上しました。(このあたりは最近の最新モデルではお決まりの表現ですが!)
• 例: 「飛行機が遅延し、乗り継ぎに失敗。荷物も紛失し、宿泊手配と医療上の理由による特別な座席が必要」という複雑な顧客サポートのシナリオにおいて、GPT-5.1では不十分だった対応が、GPT-5.2では再予約・座席確保・補償対応などの全工程を適切に調整できるようになりました。
• 通信業界の顧客対応タスク(Tau2-bench Telecom)では、98.7%という極めて高い成功率を記録しています(GPT-5.1は95.6%)。
4️⃣長文脈理解(ロングコンテキスト)の精度
膨大なドキュメントから必要な情報を探し出す能力がほぼ完璧になりました。
25万6000トークン(約数十万文字)に及ぶ長い文脈の中から情報を拾い上げるテスト(MRCRv2)において、GPT-5.1は精度が30%以下に落ち込んでいたのに対し、GPT-5.2はほぼ100%の精度を維持しています。これにより、大量の契約書や論文を読み込ませた分析が可能になります。
ちなみに、もともとGeminiは2.5移行100万トークン、GPTはこれまで40万トークンが扱えるとしており、もともと長文理解の「量」はGeminiの方が強く、ChatGPTは相対的に少ないとされて来ました。
今回の新モデルでも扱えるコンテキストの「量」は引き上げられてはいないようで、ここでいう長文理解は、長文理解の「質」にフォーカスしています。
5️⃣視覚認識(ビジョン)とコーディング
• 画像認識:チャートの読み取りやソフトウェアの画面理解におけるエラー率が約半分になりました。例えば、マザーボードの画像から部品を特定し配置を理解する能力において、GPT-5.1よりもはるかに正確な認識を示しています。(これはGemini 3が超優秀とされている領域でした。その比較でどうなのかは気になるところ)
• コーディング:実際のソフトウェアエンジニアリング課題(SWE-Bench Pro)において、55.6%のスコアを記録(GPT-5.1は50.8%)。特にフロントエンド開発や、3D要素を含む複雑なUI作成に強くなっています。(スコア的にはコーディング最強は引き続きClaude Opus 4.5のようです) December 12, 2025
履歴書・職務経歴書作成をガチると起きること
・多少経験やスキル不足でも通過する
・未経験業界、職種もビックリするくらい通過
・優良企業からのスカウトが増える
・エージェントが突然やる気を出してくる
・学歴フィルターを越えられる可能性
・面接対策に時間をかけられる
・だんだん転職活動が楽しくなってくる
手間をかけた分、確かな結果に繋がります。 December 12, 2025
内定なかなかとれないと焦るよね…
自分も新卒就活の時そんな感じだった
面接苦手なら、就職エージェントっていうサービス使ってみるのがいいよ〜!
無料で使えて、面接の質問とか傾向教えてくれる場合もある!
26卒NNTや27卒向けにおすすめとか書いたのつけとくね
https://t.co/r2zJ2GGT8X December 12, 2025
a16zの毎年恒例「来年のクリプトで楽しみな17項目」、もちろんポジショントーク強めではあるけど、方向性としてはやはり面白い。
SCやRWA、AI×エージェント、x402型の決済、予測市場、プライバシーとzkの実用化など、2025に芽が出た領域、トレンドの大枠をつかむにはちょうどいいまとめ。 https://t.co/CyQirQdKPL December 12, 2025
おはようございます。
新楽曲 『TSURUGI: NO MY』 に合わせて、PVを制作しました。
シャルロットは探偵モノなので、今回もタイトルに仕掛けがあります。
映像は HailuoAI(@Hailuo_AI) さんのエージェント機能と Sora2 をメインに、Vコンテ版で仕上げています。
コンテストで多くの方のムービーを見ると、
「インスピレーションをもらう」と同時に
「負けてられない」と強烈に思いますね。
そして、2カ月後の京都コンテストで出てくるAIアニメ作品は、
恐らく既存のTVアニメと比べても遜色ないレベルになっているでしょう。
この進化速度を考えると、さらに面白い領域に突入しそうです。
また昨日も新しいお話をいただいたので、近いうちに公開できるかも。
それでは本日もよろしくお願いいたします!
#HailuoAI December 12, 2025
24卒で辞めた後は既卒就活みたいな感じで行けるはず
第二新卒フリーター的な感じ
どの企業に応募できるかわからないなら、転職エージェントや就職エージェント使うのおすすめよ 面接対策してくれるし
以前、就活エージェントの感想とかまとめたの固定につけとくね 参考になれば! December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



