1
Calling
0post
2025.11.22 23:00
:0% :0% (-/-)
人気のポスト ※表示されているRP数は特定時点のものです
使用 Gemini 3 从零构建智能体实用指南
来自 Phil Schmid 最新发布的实用教程,核心目标是“去神秘化”AI 智能体的构建过程。Schmid 强调:智能体本质上非常简单——就是一个 LLM 放在一个循环里,加上一些工具,让模型自己决定什么时候用工具、怎么规划任务。整个教程基于 Gemini 3 Pro,从最基础的文本生成,一步步进化到能读写文件、持续对话的完整 CLI 智能体。全程代码不到 100 行,非常适合想快速上手的人。
智能体的核心组成(Schmid 的“生命体”比喻)
· 大脑(Model):Gemini 3 Pro,负责思考、规划、决定是否调用工具。
· 手和眼睛(Tools):外部函数,例如读取文件、列出目录、写入文件等。
· 工作空间/记忆(Context):对话历史 + 工具执行结果,这就是所谓的“上下文工程”。
· 生命循环(Loop):观察 → 思考 → 行动 → 观察……直到任务完成或达到终止条件。
整个流程就是经典的 ReAct 模式(Reasoning + Acting),但用 Gemini 原生函数调用实现,不依赖 LangGraph、CrewAI 等复杂框架。
逐步构建过程
1. 最基础:纯文本生成(还不是智能体)
先创建一个 Agent 类,用 gemini-3-pro-preview 模型直接生成文本。相当于一个加强版聊天机器人。
2. 第二步:加入工具(Function Calling)
· 用 JSON Schema 定义工具(名称、描述、参数)。
· 实现对应的 Python 函数(比如 read_file、write_file、list_dir)。
· 把工具定义传给模型,模型如果需要就会返回结构化的工具调用请求。
3. 第三步:闭环(真正成为智能体)
· 在代码里检测模型是否要调用工具 → 执行工具 → 把结果以 functionResponse 形式塞回模型 → 模型继续思考。
· 关键技巧:Gemini 3 有特殊的“Thought Signatures”,必须原样保留,否则会丢失链式推理能力。
· 加上系统引导指令,比如让它像 Linus Torvalds 一样说话,增加个性。
4. 第四步:多轮 CLI 交互
用 while True 循环包装,让用户可以持续输入指令,智能体就能处理多步骤任务(比如先列目录 → 再读某个文件 → 再修改内容)。
最终效果:你可以在终端里对智能体说“帮我把 data.txt 里的内容改成“Hello World””,它会自动调用 `read_file` → 思考 → write_file,一步步完成。
最佳工程实践(文章干货最集中的部分)
1. 工具设计(Tools Design)
· 工具的名称和描述必须写得极度清晰、毫不含糊,让模型一眼就能明白这个工具到底是干什么的以及什么时候该用。
· 每个工具的参数要尽量精简,只保留真正必要的字段,避免参数过多导致模型困惑或生成错误调用。
· 工具执行后的返回结果一定要对人类友好:包含清晰的成功/失败状态、详细的错误信息、必要的上下文,甚至可以主动给出下一步建议。这样模型在下一轮推理时就能获得高质量输入。
2. 上下文管理(Context Management)
· 绝不要一次性把大量文件内容或数据直接塞进上下文(容易超窗口或让模型迷失重点)。
· 优先设计“按需加载”类的工具,例如 read_file、search_database 等,让模型自己决定什么时候需要拉取哪些具体信息。
· 当对话轮次变长、上下文快要爆炸时,要么用摘要压缩历史,要么引入外部记忆系统(向量数据库、键值存储等)。
3. 避免过度工程(Avoid Over-Engineering)
· 先用“单个强大模型 + 简单 while 循环 + 原生函数调用”把原型跑通,这是性价比最高的方式。
· 只有当任务确实需要复杂的状态机、多智能体协作、回滚机制时,再引入 LangGraph、CrewAI、Autogen 等重型框架。大多数实际场景下,简单循环已经完全够用。
4. 安全与健壮性(Safety & Robustness)
· 必须设置最大循环次数(max_iterations),防止模型陷入死循环。
· 任何涉及破坏性操作的工具(删除文件、发邮件、转账等)都要加入人工确认步骤或严格的白名单机制。
· 通过强有力的系统指令(System Instruction)建立 guardrails,明确告诉模型哪些事情绝对不允许做。
5. 调试与可观测性(Debugging)
· 在开发阶段,把每一次工具调用请求、工具执行结果、模型的思考过程全部打印出来。
· 这种极高的透明度能让你瞬间定位问题是出在工具定义、返回格式,还是模型推理逻辑上,是构建可靠智能体最快的调试方式。
这些建议高度凝练,几乎适用于所有基于 LLM 的智能体项目(不管你用 Gemini、Claude、GPT 还是开源模型),强烈建议把它们当作检查清单,在每次搭建新智能体时逐条对照。
文章的核心结论
· 构建一个实用的智能体**远没有想象中复杂**,核心就是“模型 + 工具 + 循环 + 良好上下文管理”。
· 只要工具设计得好、上下文控制得当,Gemini 3 Pro 这种原生支持多工具调用的模型,完全可以单体搞定大部分任务。
· Schmid 鼓励大家先从最简原型开始跑通,再逐步增加记忆、规划器、多智能体协作等高级特性。
博客地址
https://t.co/WKZLvbP1NG November 11, 2025
4RP
╔═════════════════╗
#RockonSocialClub
FOREVER CALLING TOUR
ライブハウス公演にご来場の皆様へ
╚═════════════════╝
皆様に安全にライブをお楽しみいただくため、
あらためてご来場時の注意事項のご案内をさせていただきます。
⚠️こちらからご確認ください
https://t.co/Zy4cp0xnDM
#FOREVERCALLING2025 November 11, 2025
Rockon Social Club
Forever Calling 2025
東京公演
サポートさせていただきました。
ありがとうございました。 https://t.co/sNgRXJZKnl November 11, 2025
一応今流行りのアオリですね(笑)
「Calling」80変
キャンバスにアクリル、油彩
日展、東京での展示は23日(日)最終日となります🙏
(来年の4月に大阪展にて展示予定)
たくさんの方々に目を留めて頂き光栄の極みです。ありがとうございます。
ラスト2日間、何卒よろしくお願い申し上げます🥹🙏✨
#日展 #アナログはいいぞ November 11, 2025
#おはまりcalling
#おはようVtuber
#おはようVライバー
#VRChat #いいね返し
#コメント大歓迎
皆おはまり!!
今日も一日宜しくお願いします!!
誕生日お祝い有難う御座いました!✨
二日目インスタ開くの忘れてました...
すみません!!
今日はモンハンのイベント行ってきます!
狩るぞ~!✨
↓「ほら!此処景色良いから撮ろ?」 November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



