1
佐久間由衣写真集 sonnet
0post
2025.12.04 09:00
:0% :0% (-/男性)
人気のポスト ※表示されているRP数は特定時点のものです
【Claudeの高度なツール利用機能3つの要点】
AnthropicはClaude Developer Platformに3つのベータ機能を追加し、Claudeがツールを動的に発見・学習・実行できるようになった。対象はTool Search Tool、Programmatic Tool Calling、Tool Use Examplesの3種類であり、大規模なツール群を扱うAIエージェントが現実世界の業務フローに組み込まれることを想定した設計となっている。
Tool Search Toolはツール定義をすべて事前ロードするのではなく、必要に応じて検索してロードする仕組みである。GitHubやSlackなど58ツールで約55Kトークンかかっていた定義を、検索用ツール約500トークンとオンデマンド展開3Kトークン程度に抑え、総コンテキストを約8.7Kトークンに削減しつつツール選択精度も向上させた。内部評価では、大規模ツールライブラリでのMCPタスクにおいてOpus4が49%から74%、Opus4.5が79.5%から88.1%へと精度が改善している。
Programmatic Tool Callingは、Claudeがコード実行環境内でツールを関数として呼び出し、ログやテーブルなど大きな中間結果をコンテキストに入れる前に集計・フィルタする仕組みである。例えば経費データ2,000行・200KB相当を扱うタスクでも、最終的な違反ユーザーのリスト1KBだけをモデルに戻せるため、複雑なリサーチタスクで平均トークン使用量が43,588から27,297へと約37%削減され、内部知識検索やGIAベンチマークのスコアも向上した。
Tool Use Examplesは、ツール定義にinput_examplesとして具体的な入力例を付与し、JSON Schemaでは表現しづらい使用パターンをモデルに示す機能である。期限付きのクリティカル障害チケットやラベル付き機能要望、タイトルのみの内部タスクといった例を並べることで、日付形式やID規約、オプションパラメータの組み合わせなどを暗黙的に共有でき、内部テストでは複雑なパラメータ処理の精度が72%から90%に向上した。なおTool Search Toolとは併用できず、ツール使用例はクライアントツールのみに付与可能となっている。
これら3機能は、ツール定義によるコンテキスト肥大にはTool Search Tool、大きな中間結果や多段ワークフローにはProgrammatic Tool Calling、パラメータエラーにはTool Use Examplesといった形でボトルネックごとに使い分けることが推奨される。Claude Opus4.5およびSonnet4.5ではadvanced-tool-use-2025-11-20ベータヘッダーを付与することで利用可能となり、例えばClaude for ExcelではProgrammatic Tool Callingを用いることで数千行のスプレッドシートをコンテキストを圧迫せずに読み書きする実装が行われている。 December 12, 2025
1RP
■ Gemini は『検索しない』ことだけが問題じゃないよ。検索させても普通に(他と比べて)間違えまくるよって話
かなり認知されてきたけど、まだ誤解があるから補足するね。
これ『検索すべきタイミングで検索してくれない』ことだけが問題だと思っている人がいるけど、違うよ。
だから『カスタム指示で(または都度プロンプトでの指定で)検索を促せば解決する』という単純な問題じゃないからね。
(それで解決する簡単な質問もそりゃあるだろうけど)
ワイが前から言ってるのは、Geminiは『調べる』ってのもそうだけど、『調べて手に入った情報の処理、解釈の仕方も下手くそ』だってこと。
前にも載せたけど、例えば
『ここ1ヶ月で、ChatGPTのDeep Researchのモデルは賢くなりましたか?』
って質問を投げる。
真実は『Deep Researchのモデルにアップデートは入ってない』ね。
で、答えはこんな感じ(要約。詳しくは画像みて)
Gemini 3 Pro: 『ご明察。GPT-5.1になったからね』
GPT-5.1 Thinking: 『Deep Researchのモデルのアップデートは無いよ。周辺のアップデートはあるから、それで使いやすくなってるってのはあるかも』
『OpenAIの機能の質問をするのは不公平』って思う?
Claude は普通に正解するけどね。
OpusどころかSonnetで十分。
『うちのGeminiでは正解したし!』って?
そりゃあLLMですもん、確率の問題でもたまには上手くいくよ。
10回やって他と比べてみ、正解率明らかに低いから。
ちなみにここではGeminiには最新の状況を踏まえて回答するために検索しろというカスタム指示を入れているので、ちゃんと検索している。その下駄を履かせたうえでGeminiだけ頓珍漢なことを言ってる。
検索さえしたら解決?
それは違うよ。
情報があっても、その理解(解釈)自体が甘い。
1枚目:Gemini 3 Pro
2枚目: GPT-5.1 Thinking
3枚目: Claude Sonnet 4.5 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



