iter
0post
2025.11.22 23:00
:0% :0% (-/男性)
人気のポスト ※表示されているRP数は特定時点のものです
使用 Gemini 3 从零构建智能体实用指南
来自 Phil Schmid 最新发布的实用教程,核心目标是“去神秘化”AI 智能体的构建过程。Schmid 强调:智能体本质上非常简单——就是一个 LLM 放在一个循环里,加上一些工具,让模型自己决定什么时候用工具、怎么规划任务。整个教程基于 Gemini 3 Pro,从最基础的文本生成,一步步进化到能读写文件、持续对话的完整 CLI 智能体。全程代码不到 100 行,非常适合想快速上手的人。
智能体的核心组成(Schmid 的“生命体”比喻)
· 大脑(Model):Gemini 3 Pro,负责思考、规划、决定是否调用工具。
· 手和眼睛(Tools):外部函数,例如读取文件、列出目录、写入文件等。
· 工作空间/记忆(Context):对话历史 + 工具执行结果,这就是所谓的“上下文工程”。
· 生命循环(Loop):观察 → 思考 → 行动 → 观察……直到任务完成或达到终止条件。
整个流程就是经典的 ReAct 模式(Reasoning + Acting),但用 Gemini 原生函数调用实现,不依赖 LangGraph、CrewAI 等复杂框架。
逐步构建过程
1. 最基础:纯文本生成(还不是智能体)
先创建一个 Agent 类,用 gemini-3-pro-preview 模型直接生成文本。相当于一个加强版聊天机器人。
2. 第二步:加入工具(Function Calling)
· 用 JSON Schema 定义工具(名称、描述、参数)。
· 实现对应的 Python 函数(比如 read_file、write_file、list_dir)。
· 把工具定义传给模型,模型如果需要就会返回结构化的工具调用请求。
3. 第三步:闭环(真正成为智能体)
· 在代码里检测模型是否要调用工具 → 执行工具 → 把结果以 functionResponse 形式塞回模型 → 模型继续思考。
· 关键技巧:Gemini 3 有特殊的“Thought Signatures”,必须原样保留,否则会丢失链式推理能力。
· 加上系统引导指令,比如让它像 Linus Torvalds 一样说话,增加个性。
4. 第四步:多轮 CLI 交互
用 while True 循环包装,让用户可以持续输入指令,智能体就能处理多步骤任务(比如先列目录 → 再读某个文件 → 再修改内容)。
最终效果:你可以在终端里对智能体说“帮我把 data.txt 里的内容改成“Hello World””,它会自动调用 `read_file` → 思考 → write_file,一步步完成。
最佳工程实践(文章干货最集中的部分)
1. 工具设计(Tools Design)
· 工具的名称和描述必须写得极度清晰、毫不含糊,让模型一眼就能明白这个工具到底是干什么的以及什么时候该用。
· 每个工具的参数要尽量精简,只保留真正必要的字段,避免参数过多导致模型困惑或生成错误调用。
· 工具执行后的返回结果一定要对人类友好:包含清晰的成功/失败状态、详细的错误信息、必要的上下文,甚至可以主动给出下一步建议。这样模型在下一轮推理时就能获得高质量输入。
2. 上下文管理(Context Management)
· 绝不要一次性把大量文件内容或数据直接塞进上下文(容易超窗口或让模型迷失重点)。
· 优先设计“按需加载”类的工具,例如 read_file、search_database 等,让模型自己决定什么时候需要拉取哪些具体信息。
· 当对话轮次变长、上下文快要爆炸时,要么用摘要压缩历史,要么引入外部记忆系统(向量数据库、键值存储等)。
3. 避免过度工程(Avoid Over-Engineering)
· 先用“单个强大模型 + 简单 while 循环 + 原生函数调用”把原型跑通,这是性价比最高的方式。
· 只有当任务确实需要复杂的状态机、多智能体协作、回滚机制时,再引入 LangGraph、CrewAI、Autogen 等重型框架。大多数实际场景下,简单循环已经完全够用。
4. 安全与健壮性(Safety & Robustness)
· 必须设置最大循环次数(max_iterations),防止模型陷入死循环。
· 任何涉及破坏性操作的工具(删除文件、发邮件、转账等)都要加入人工确认步骤或严格的白名单机制。
· 通过强有力的系统指令(System Instruction)建立 guardrails,明确告诉模型哪些事情绝对不允许做。
5. 调试与可观测性(Debugging)
· 在开发阶段,把每一次工具调用请求、工具执行结果、模型的思考过程全部打印出来。
· 这种极高的透明度能让你瞬间定位问题是出在工具定义、返回格式,还是模型推理逻辑上,是构建可靠智能体最快的调试方式。
这些建议高度凝练,几乎适用于所有基于 LLM 的智能体项目(不管你用 Gemini、Claude、GPT 还是开源模型),强烈建议把它们当作检查清单,在每次搭建新智能体时逐条对照。
文章的核心结论
· 构建一个实用的智能体**远没有想象中复杂**,核心就是“模型 + 工具 + 循环 + 良好上下文管理”。
· 只要工具设计得好、上下文控制得当,Gemini 3 Pro 这种原生支持多工具调用的模型,完全可以单体搞定大部分任务。
· Schmid 鼓励大家先从最简原型开始跑通,再逐步增加记忆、规划器、多智能体协作等高级特性。
博客地址
https://t.co/WKZLvbP1NG November 11, 2025
4RP
まあ、私のお馬鹿さんな話でもきいてください。
今朝、嫌な予感しましたがこれを引き起こしました。
発端は昨日の献血中にゴクゴク飲んでしまった。スポーツドリンクです。
喉が乾いていたので、一気に500ml をゴクゴク。
おかわりをいただいて更にごくごく。
気付けば1時間以内に1literのスポーツドリンクをゴクゴク。
スポーツドリンクの短時間での短時間飲用は、一歩間違えると大変なことになります。
よく朝、なんか動悸がするのです。心臓バクバク。
なんかフラフラ、頭がぼーっとしました。
なにが起きたかというと、急性の一過性の糖尿病です。
これは、私のようなおじいちゃんだけではなく、若者でも起こり得ますので注意が必要です。
間違えると心不全を起こしたりしますから、短時間で甘い飲み物をたくさん飲むのはやめましょう。
詳しくは以前私の夜のライブ配信でお話ししてますから、良かったら聴いてみてください。
スポーツドリンクは、運動後やたくさん汗をかいたあとはよい飲み物で、献血など大量の水分を失う時の水分補給には最適です。
しかし!飲み過ぎ留都大変なことになります。
#清涼飲料水ケトアシドーシス
#ペットボトル症候群
https://t.co/lJamxKsLpB November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。









