2026/6/20 9:34:48
网站建设
项目流程
祥云平台网站管理系统,全自动精准引流软件,做网站賺钱,wordpress更换端口简介
本文整合了Anthropic官方的AI Agent开发指南#xff0c;系统介绍了构建高效AI Agent的核心理念与四大基石#xff08;知识、行动、思考、记忆#xff09;#xff0c;详细阐述了智能体架构模式选择、提示工程技巧及评估方法。通过Claude玩宝可梦等实战案例…简介本文整合了Anthropic官方的AI Agent开发指南系统介绍了构建高效AI Agent的核心理念与四大基石知识、行动、思考、记忆详细阐述了智能体架构模式选择、提示工程技巧及评估方法。通过Claude玩宝可梦等实战案例分享了长短期记忆结合、上下文窗口压缩等关键技术为开发者提供了从入门到精通的完整路线图助力构建强大、可靠且高效的AI Agent系统。✔引言最近在Agent构建过程中遇到挺多问题遂决定重新梳理一下思路。学习AgentClaude官方的资料不可不读他们曾分享了相当多的Agent领域的技术博客和视频其中包括知名的《Building Effective AI Agents》等十余篇我把这些多篇技术博客与视频进行整合梳理出了这篇不一定完整的Agent开发的学习路线图希望能帮助你了解如何学习构建强大、可靠且高效的AI Agent系统。本文档内容由Rosa基于Anthropic截止到25年9月的资料进行手工整理在AI的辅助下完成编辑。✔第一部分核心理念与准备工作在开始构建之前理解 Anthropic 提倡的核心理念至关重要。这能帮助您在开发过程中做出正确的技术选型和架构决策。理解智能体系统Agentic Systems的两种形态工作流Workflows: 系统中的 LLM 和工具由预定义的代码路径进行编排。它就像一条固定的流水线每一步都由您的代码精确控制。适用场景任务路径明确、可预测。例如接收用户邮件 - 提取关键信息 - 分类意图 - 调用相应工具 - 生成回复草稿。例如提取文本 - 翻译 - 格式化。智能体Agents: LLM 在一个循环中动态地指导自己的流程和工具使用直到找到解决方案。它更具自主性是真正的“思考者”和“执行者”。 - 适用场景开放式、无法预知所有步骤的复杂任务。例如根据一份设计文档编写一个新功能、对一个全新的数据集进行探索性分析、在游戏中从零开始学习通关。开发核心原则从简开始按需迭代寻找最简单的解决方案并非所有问题都需要复杂的 Agent。很多时候一个精心设计的单次 LLM 调用结合检索增强RAG和上下文示例就已经足够。过度设计是 Agent 开发中最常见的陷阱。仅在必要时增加复杂性只有当简单的方案无法满足需求且您能通过评估证明增加复杂性如多步工作流或自主 Agent能带来显著性能提升时才应采纳。Agent 系统通常用更高的延迟和成本换取更好的任务性能务必权衡。构建可受益于模型进步的护城河您的产品价值不应仅仅是模型本身的能力。优秀的 Agent 应用应该是“当模型变得更聪明时我的产品会变得更好”而不是“当模型变得更聪明时我的护城河就消失了”。您的核心价值应在于围绕模型的独特编排、数据、工具和工作流。何时应该使用 Agent实用的检查清单任务是否复杂如果一个人类可以清晰地列出完成任务的每一步那么您可能只需要一个工作流。Agent 适用于那些您知道最终目标但具体路径不清晰的场景。任务价值是否足够高Agent 会消耗更多资源Token、时间和计算。请确保您将其用在能产生高价值的任务上例如显著提升高技能员工的效率或直接产生收入。任务的各个部分是否可行您能否为 Agent 提供完成任务所需的工具和信息如果 Agent 需要访问一个不存在的 API或者信息被完全隔离那么它将无能为力。错误的成本是否可控如果一次错误会导致灾难性后果例如在生产环境中错误地删除了数据库那么独立的 Agent 可能不适合需要引入“人在回路”Human-in-the-loop进行关键步骤的审批。如果错误可以轻松恢复例如一次失败的网页搜索可以重试则更适合 Agent。建立正确的开发者心态“像 Agent 一样思考”这是Anthropic 工程师强调的构建高效 Agent 最重要的原则之一。核心思想您必须设身处地地从 Agent 的视角体验它的“世界”——即它能使用的工具和从工具返回的信息。实操方法在调试时进行一次思想实验。想象自己被关在一个没有窗户的房间里唯一的输入是屏幕上显示的文本如同 Agent 看到的上下文唯一的输出是调用一组定义好的工具。您能完成任务吗例如在“Claude 玩宝可梦”项目中工程师们会闭上眼睛一分钟然后睁开眼看一秒钟屏幕截图再闭上眼思考下一步操作。这种共情能让您立刻发现工具描述的模糊之处、信息返回的不足以及 Agent 面临的真正困境。深入学习建议要深入理解 Agent 与工作流的区别、何时使用 Agent 的清单以及“像 Agent 一样思考”的心态可以观看视频《Building Effective Agents》和《Prompting for Agents》。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】一个强大的智能体离不开四大核心能力知识、行动、思考和记忆。基石一赋予知识 —— 高效的检索增强生成RAG传统 RAG 的局限性切分文档导致上下文丢失。Anthropic 的解决方案上下文检索Contextual Retrieval核心思想在编码前使用 LLM 为每个文本块生成一段简明的“上下文描述”显著提升检索准确率。效果检索失败率降低49%结合重排序Reranking可降低67%。深入阅读建议详细实现方法请阅读《Contextual Retrieval in AI Systems》全文及其中的cookbook示例。基石二赋予行动能力 —— 设计与优化工具Tools工具是 Agent 与世界交互的桥梁。Anthropic 提供了多种强大的内置工具并强调了工具设计的重要性。Anthropic 提供的强大工具示例代码执行Code Execution为 Claude 提供一个安全的、沙箱化的计算环境。当面对需要精确计算、数据分析或可重复执行的任务时Claude 会选择编写并执行 Python 代码而不是直接回答。这使得结果更可靠、可审计。网页搜索Web Search这不是简单的“搜索框”而是一个智能化的研究过程。Claude 会根据任务自主决定搜索什么、搜索多少次、如何深入挖掘并为所有发现提供引用来源确保信息的可追溯性。MCP 连接器MCP Connector允许你的 Agent 连接到庞大且不断增长的第三方工具生态系统如 Asana, Zapier, Cloudflare极大地扩展了 Agent 的能力边界。高效工具设计的关键原则选择正确的工具创建少数几个有思想的、面向工作流的工具而不是为每个 API 端点都创建一个工具。应创建少数几个有思想的、面向工作流的工具整合多个底层操作。反例list_users,list_events,create_event三个独立工具。正例一个schedule_event工具它在内部完成查找参会者有空时间、预定会议室、发送邀请等一系列操作。命名空间Namespacing为工具添加清晰的前缀如asana_projects_search,jira_issues_get明确功能边界避免 Agent 在功能重叠的工具间混淆。返回有意义的上下文工具的返回值应优先考虑对 Agent 有用的自然语言信息而不是低级的技术标识符如user_uuid: u-1a2b3c。Agent 更容易理解和处理user_name: 张三。优化 Token 效率为可能返回大量数据的工具实现分页、截断等功能。当截断时返回有帮助的提示如“结果已截断共找到 150 条记录当前显示前 20 条。请使用更精确的查询或翻页参数。”精心编写工具描述Prompt-Engineering这是最常被忽视但效果最显著的一点。要像给团队新成员写函数文档一样清晰、明确、无歧义地描述工具的功能、每个参数的含义和预期的格式。深入学习建议观看《Building Blocks for Tomorrow’s AI Agents》可以直观了解代码执行、网页搜索等工具的强大功能。而《Writing effective tools for AI agents》则深入讲解了如何从零开始设计、评估和优化你自己的工具。基石三赋予思考能力 —— “思考”工具“think” tool为了处理复杂任务Agent 需要一个“思考空间”来规划、分析和反思。它是什么一个特殊的工具不执行任何外部操作只是让 Agent 有机会在行动前或行动后将自己的思考过程、分析、计划记录下来。与“扩展思考”的区别“扩展思考”是在生成任何响应之前进行的深度规划而thinktool 则是在多步工具调用的过程中用于处理新信息和进行决策。何时使用在需要分析工具输出、遵循复杂策略、或进行错误代价高昂的顺序决策时。如何实现在工具列表中添加think工具定义并在系统提示中通过示例指导 Agent 何时以及如何使用它。深入阅读建议获取thinktool 的标准定义和最佳实践请阅读《The “think” tool: Enabling Claude to stop and think》。基石四赋予记忆 —— 克服上下文窗口限制这是从“Claude 玩宝可梦”项目中提炼出的关键实战技巧。问题Agent 在长时间运行时会超出模型的上下文窗口如 200k tokens导致“失忆”忘记任务的初始目标和之前的操作。解决方案长短期记忆结合长期记忆Long-term Memory为 Agent 提供一个外部知识库如一个简单的文本文件或数据库。Agent 可以将关键信息、总体目标、已完成的里程碑、学到的经验教训等写入这个文件。这就像电影《记忆碎片》中的便签条持久化存储核心记忆。上下文窗口压缩Context Window Compaction当上下文接近满时例如达到 190k tokens自动调用一个工具让 Claude 将当前的对话历史和操作记录总结成一段简短精炼的摘要。然后开启一个全新的会话将这段摘要和从长期记忆文件中读取的核心信息一起作为初始上下文从而实现无限运行。深入学习建议这个极其重要的实战技巧详细源于《Lessons on AI agents from Claude Plays Pokemon》视频是解决长任务 Agent 问题的关键。✔第三部分智能体架构模式选择根据任务的复杂性您可以选择或组合以下几种经过验证的架构模式提示链Prompt Chaining线性执行适用于可清晰分解的固定子任务。路由Routing根据输入分类导向不同处理路径。适用于需要对不同类型请求进行专门处理的场景如客服。并行化Parallelization将任务分解为多个独立子任务并行处理或对同一任务运行多次投票。编排者-工作者Orchestrator-Workers一个中心的“编排者”LLM 动态地分解任务并将其分配给多个“工作者”LLM 并行处理。适用于无法预知子任务的复杂场景如编码、研究。评估者-优化者Evaluator-Optimizer一个 LLM 生成响应另一个 LLM 在循环中对其进行评估和提供反馈进行迭代优化。自主智能体Autonomous Agents最高级的模式LLM 在一个循环中自主地使用工具、接收环境反馈并决定下一步行动。深入阅读建议每种模式的详细图解和示例请参考《Building Effective AI Agents》。✔第四部分高级主题与未来展望1. 构建多智能体系统为何需要通过并行处理和分离关注点解决单个 Agent 无法完成的超复杂任务。架构模式通常采用编排者-工作者模式。未来探索多智能体间的交互会产生有趣的涌现行为例如让多个 Claude 实例扮演不同角色玩“狼人杀”游戏可以帮助我们更好地理解模型的行为。2. Agent 应用的未来趋势被低估的领域为企业自动化重复性任务即使每次只节省一分钟但当你可以将这个任务的执行频率提高100倍时其价值是巨大的。被高估的领域目前面向消费者的 Agent如全自动预订假期。因为完全指定个人偏好和验证结果的成本几乎和自己动手一样高。深入学习建议关于多智能体系统的架构和提示工程请阅读《How we built our multi-agent research system》。关于未来趋势的讨论可观看《Tips for building AI agents》。✔第五部分Agent 的提示工程为 Agent 编写提示与传统的提示工程有很大不同。给予合理的启发式原则Heuristics而非僵化的规则不要试图预测所有情况。相反应教会 Agent 一些通用原则。例如为 Claude Code 灌输“不可逆性”的概念让它避免执行rm -rf等可能对用户环境造成永久损害的操作。为 Agent 设定“预算”例如告诉它简单的查询应使用少于 5 次工具调用复杂的则可以用到 15 次避免其无休止地搜索。明确指导工具选择和思考过程不要假设 Agent 知道在您的特定业务场景下应该优先使用哪个工具。在提示中明确指出“如果需要查询公司内部信息优先搜索 Slack”。引导 Agent 如何使用“思考”过程。例如在研究任务开始前提示它在第一个思考块中规划好“查询有多复杂需要多少次工具调用如何判断成功”等问题。警惕意外的副作用您给出的指令可能会被 Agent “过度执行”。例如当您告诉 Agent “直到找到最高质量的来源再停止”它可能会因为找不到“完美”来源而陷入无限搜索。因此需要设置停止条件。关于“少样本示例Few-shot Examples”对于先进的模型和 Agent 场景提供大量具体的、循规蹈矩的示例反而会限制模型的智能和创造力。更有效的方法是给出高层次的原则和策略让模型自主发挥。深入学习建议这部分内容是《Prompting for Agents》视频的核心对于编写高质量的 Agent 系统提示至关重要。✔第六部分评估贯穿始终的关键环节衡量你的结果是构建 Agent 过程中最重要、也最容易被忽视的一环。从小样本开始尽早评估不要等到搭建了包含数百个案例的庞大评估框架才开始。在开发初期即使是10-20个手动测试用例也能揭示出巨大的问题因为初期的改进效果通常非常显著。使用真实世界的任务评估用例应反映 Agent 在实际应用中会遇到的问题而不是简单的“沙盒”或编程竞赛题。善用 LLM-as-judge对于难以程序化评估的输出可以使用 LLM 作为裁判根据预设的评分标准Rubric来打分。关注最终状态评估Final-state Evaluation对于会改变环境状态的 Agent如客服 Agent 修改数据库评估重点应是任务完成后的“最终状态”是否正确而不是过程中的每一步。深入学习建议评估的重要性在《Advice For Building AI Agents》和《Prompting for Agents》视频中被反复强调。✔第七部分来自一线的终极课程Claude 玩宝可梦这个项目不仅有趣更是一个适合用于了解 Agent 本质的绝佳案例详细案例可在《Lessons on AI agents from Claude Plays Pokemon》中了解。**模型的进步在于“策略”而非“感官”Claude 玩宝可梦的能力从 3.5 到 3.7 的巨大飞跃主要不是因为它的视觉能力看清游戏画面变强了而是因为它制定策略、从失败中学习、质疑旧策略并尝试新方法坚韧性**的能力得到了质的提升。这正是高级 Agent 的核心。失败揭示了模型的根本局限与工程解决方案缺乏时间感Claude 会连续 8 小时按一个按钮试图关闭一个它误认为是对话框的“门垫”。解决方案在信息中加入“步数计数器”赋予它一个时间的代理指标并提示它“如果长时间做某件事没有进展应该重新考虑策略”。缺乏自我认知它不知道自己“看不清屏幕”因此会一直撞墙。解决方案通过提示和提供额外信息帮助它建立对自身局限的“元认知”。灾难性遗忘在花费三天走出迷宫离出口仅 15 步时它迷路了然后使用“逃生绳”传送回了洞穴入口前功尽弃。解决方案上文提到的“长短期记忆”机制。从兴趣出发建立直觉构建 Agent 最好的方式是从一个您热爱的、有趣的项目开始实践。通过长时间、高频次的互动您会对模型的优点、缺点和“脾气”建立起深刻的直觉。这种通过实践获得的经验比任何一篇技术文档都更有价值。通过这份融合了理论与实践的完整路线图希望你可以系统地构建、优化和扩展您的 AI Agent真正释放 Claude 的潜力。当然也需要注意以上均为来自Anthropic一家的观点建议实际还有多家的经验也非常值得参考学习强烈建议结合多方信息和自身的实践进行消化理解后面有机会我也会继续整理和分享。✔原文参考博客文章 (Blog Posts)**Contextual Retrieval in AI Systems**[1]**Building Effective AI Agents**[2]**How we built our multi-agent research system**[3]**Writing effective tools for AI agents—using AI agents**[4]**The think tool: Enabling Claude to stop and think**[5]视频内容 (Videos)**Lessons on AI agents from Claude Plays Pokemon**[6]**Advice For Building AI Agents**[7]**Building Blocks for Tomorrow’s AI Agents**[8]**Prompting for Agents | Code w/ Claude**[9]**Tips for building AI agents**[10]如何学习AI大模型我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。1.AI大模型学习路线图2.100套AI大模型商业化落地方案3.100集大模型视频教程4.200本大模型PDF书籍5.LLM面试题合集6.AI产品经理资源合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】