网站开发后台软件溧阳常州做网站
2026/6/19 23:55:45 网站建设 项目流程
网站开发后台软件,溧阳常州做网站,如何为产品做网站,网站开发财务文章介绍智能体(AI Agent)作为大语言模型(LLM)的进阶形态#xff0c;通过赋予LLM规划、记忆和工具使用三大核心能力#xff0c;使其能够像人类一样自主完成复杂任务。详细阐述了智能体的工作原理#xff0c;包括任务分解、思维链/思维树推理机制、短期/长期记忆管理#xf…文章介绍智能体(AI Agent)作为大语言模型(LLM)的进阶形态通过赋予LLM规划、记忆和工具使用三大核心能力使其能够像人类一样自主完成复杂任务。详细阐述了智能体的工作原理包括任务分解、思维链/思维树推理机制、短期/长期记忆管理以及通过Function Calling实现工具调用。最后介绍了MetaGPT等开发框架并展望了智能体技术的未来发展潜力。大语言模型 vs 人类大语言模型很强大就像人类的大脑一样拥有思考的能力。如果人类只有大脑没有四肢没有工具是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢大模型是不是就会打破次元壁从数字世界走向现实世界与现实世界实现梦幻联动呢大语言模型后文将用 LLM 指代可以接受输入可以分析推理、可以输出文字\代码\媒体。然而其无法像人类一样拥有规划思考能力、运用各种工具与物理世界互动以及拥有人类的记忆能力。LLM接受输入、思考、输出人类LLM接受输入、思考、输出记忆工具规划如果我们给 LLM 配备上与物理世界互动的工具、记忆能力、规划思考能力。LLM 是否就可以像人类一样能够自主思考并规划完成任务的过程能检索记忆能使用各种工具提高效率最终完成某个任务。智能体是什么智能体的英文是 AgentAI 业界对智能体提出了各种定义。个人理解智能体是一种通用问题解决器。从软件工程的角度看来智能体是一种基于大语言模型的具备规划思考能力、记忆能力、使用工具函数的能力能自主完成给定任务的计算机程序。图 1. 由 LLM 驱动的智能体系统如图 1 所示在基于 LLM 的智能体中LLM 的充当着智能体的“大脑”的角色同时还有 3 个关键部分规划Planning: 智能体会把大型任务分解为子任务并规划执行任务的流程智能体会对任务执行的过程进行思考和反思从而决定是继续执行任务或判断任务完结并终止运行。记忆Memory: 短期记忆是指在执行任务的过程中的上下文会在子任务的执行过程产生和暂存在任务完结后被清空。长期记忆是长时间保留的信息一般是指外部知识库通常用向量数据库来存储和检索。工具使用Tool use为智能体配备工具 API比如计算器、搜索工具、代码执行器、数据库查询工具等。有了这些工具 API智能体就可以是物理世界交互解决实际的问题。智能体能做什么相信看到这里我们已经对智能体有了基本的认知。如果你还觉得智能体这个概念有点抽象没关系现在我们来点好玩的一起来看看智能体能玩出什么花样智能体之调研员调研员智能体可以根据用户的调研问题从搜索引擎上搜索资料并总结然后生成调研报告。这里使用 MetaGPT 框架中的调研员 示例来展示一个智能体的实际作用及其构成。运行一下试试输入调研课题调研特斯拉 FSD 和华为 ADS 这两个自动驾驶系统特斯拉FSD vs 华为ADS智能体执行调研图2. 从搜索引擎进行搜索并获取Url地址列表图左为冯·诺依曼右为奥本海默背后是世界上第一台冯·诺依曼架构的“现代”计算机图3. 浏览网页并总结网页内容图4.生成调研报告输出调研报告metaGPT 生成并保存了调研报告文件特斯拉FSD vs 华为ADS.md图5拆解调研员调研员智能体构成回到前文所说的如果仅有 LLM 这个大脑是无法完成整个调研流程的。在调研员智能体中为 LLM 大脑配备了规划、工具、记忆的能力使得他能独立完成调研任务下面列出其基本构成构成分三部分角色、工具、记忆。在角色中会注册各种工具定义思考规划的方式以及本身具备的短期记忆能力。图解调研员智能体图6智能体的关键构成img智能体 如上图所示在基于 LLM 的智能体中LLM 的充当着智能体的“大脑”的角色同时还有 3 个关键部分规划Planning、记忆Memory、工具使用Tool use规划Planing规划可以为理解观察和思考。如果用人类来类比当我们接到一个任务我们的思维模式可能会像下面这样:我们首先会思考怎么完成这个任务。然后我们会审视手头上所拥有的工具以及如何使用这些工具高效地达成目的。我们会把任务拆分成子任务就像我们会使用 TAPD 做任务拆分。在执行任务的时候我们会对执行过程进行反思和完善吸取教训以完善未来的步骤执行过程中思考任务何时可以终止这是人类的规划能力我们希望智能体也拥有这样的思维模式因此可以通过 LLM 提示工程为智能体赋予这样的思维模式。在智能体中最重要的是让 LLM 具备这以下两个能力子任务分解通过 LLM 使得智能体可以把大型任务分解为更小的、更可控的子任务从而能够有效完成复杂的任务。思维链Chain of Thoughts, CoT思维链已经是一种比较标准的提示技术能显著提升 LLM 完成复杂任务的效果。当我们对 LLM 这样要求「think step by step」会发现 LLM 会把问题分解成多个步骤一步一步思考和解决能使得输出的结果更加准确。这是一种线性的思维方式。思维链的 prompt 可以像是如下这样这里只是一个极简的 prompt实际会按需进行 prompt 调优Answer the question: Q: {question}? Lets think step by step:思维树Tree-of-thought, ToT对 CoT 的进一步扩展在思维链的每一步推理出多个分支拓扑展开成一棵思维树。使用启发式方法评估每个推理分支对问题解决的贡献。选择搜索算法使用广度优先搜索BFS或深度优先搜索DFS等算法来探索思维树并进行前瞻和回溯。图7反思和完善智能体在执行任务过程中通过 LLM 对完成的子任务进行反思从错误中吸取教训并完善未来的步骤提高任务完成的质量。同时反思任务是否已经完成并终止任务。ReAct刚接触到这个单词时脑子里冒出来的是 「React 是由 Facebook 开源的一个进行创建用户界面的一款 JavaScript 库…」打住我们好像走错片场了此 React 非彼 ReAct •﹏• ReAct[Yao et al. 2023] 《ReAct: Synergizing Reasoning and Acting in Language Models》 这篇论文提出一种用于增强大型语言模型的方法它通过结合推理Reasoning和行动Acting来增强推理和决策的效果。推理ReasoningLLM 基于「已有的知识」或「行动Acting后获取的知识」推导出结论的过程。行动ActingLLM 根据实际情况使用工具获取知识或完成子任务得到阶段性的信息。为什么结合推理和行动就会有效增强 LLM 完成任务的能力这个问题其实很好回答我们用上面的「调研员智能体」举例我提出了问题「特斯拉 FSD 对比华为 ADS」下面列出几种不同规划模式的推演仅推理Reasoning OnlyLLM 仅仅基于已有的知识进行推理生成答案回答这个问题。很显然如果 LLM 本身不具备这些知识可能会出现幻觉胡乱回答一通。仅行动Acting Only大模型不加以推理仅使用工具比如搜索引擎搜索这个问题得出来的将会是海量的资料不能直接回到这个问题。推理行动Reasoning and ActingLLM 首先会基于已有的知识并审视拥有的工具。当发现已有的知识不足以回答这个问题则会调用工具比如搜索工具、生成报告等然后得到新的信息基于新的信息重复进行推理和行动直到完成这个任务。其推理和行动的步骤会是如下这样111121122 ![](http://cdn.zhipoai.cn/9040d91b.jpg) 图8 通过巧妙的 promt 提示设计使得 LLM 重复地执行推理和行动最终完成任务。ReAct 的 prompt 模版的大致思路为: plaintext Thought思考: ... Action行动: ... Observation观察: ... Thought思考: ... Action行动: ... Observation观察: ... ...(Repeated many times重复多次)记忆Memory记忆是什么当我们在思考这个问题其实人类的大脑已经在使用记忆。记忆是大脑存储、保留和回忆信息的能力。记忆可以分为不同的类型短期记忆或工作记忆这是一种持续时间较短的记忆能够暂时存储和处理有限数量的信息。例如记住一个电话号码直到拨打完毕。长期记忆这是一种持续时间较长的记忆可以存储大量信息从几分钟到一生。长期记忆可以进一步分为显性记忆和隐性记忆。显性记忆可以有意识地回忆和表达的信息显性记忆又可以分为情景记忆个人经历的具体事件和语义记忆一般知识和概念。隐性记忆这种记忆通常是无意识的涉及技能和习惯如骑自行车或打字。仿照人类的记忆机制智能体实现了两种记忆机制:短期记忆在当前任务执行过程中所产生的信息比如某个工具或某个子任务执行的结果会写入短期记忆中。记忆在当前任务过程中产生和暂存在任务完结后被清空。长期记忆长期记忆是长时间保留的信息。一般是指外部知识库通常用向量数据库来存储和检索。工具使用Tool useLLM 是数字世界中的程序想要与现实世界互动、获取未知的知识或是计算某个复杂的公式等都离不开不工具。所以我们需要为智能体配备各种工具以及赋予它使用工具的能力。工具是什么它可以是锤子、螺丝刀也可以是函数function、软件开发工具包sdk。工具是人类智慧的具象化扩展我们的能力提升工作效率。在智能体中工具就是函数Function工具使用就是调用函数Call Function。在 LLM 中实现函数调用使用到 LLM 的这个能力:[Function Calling]Function Calling 是一种实现大型语言模型连接外部工具的机制。通过 API 调用 LLM 时调用方可以描述函数包括函数的功能描述、请求参数说明、响应参数说明让 LLM 根据用户的输入合适地选择调用哪个函数同时理解用户的自然语言并转换为调用函数的请求参数通过 JSON 格式返回。调用方使用 LLM 返回的函数名称和参数调用函数并得到响应。最后如果需求把函数的响应传给 LLM让 LLM 组织成自然语言回复用户。function calling 具体工作流程如下图所示图9不同 LLM 的 API 接口协议会有所不同下文将以OpenAI 的 API 协议为例说明如何实现 Function Calling函数描述我们可以按照智能体的需要来实现函数比如前文的「调研员」智能体为其实现了这些函数WebBrowseAndSummarize浏览网页并总结网页内容ConductResearch生成调研报告等。如果是一个智能家居的智能体可能会需要这些函数开关灯、开光空调、获取环境信息等。函数的实现在这里不展开赘述一个函数可以自行编码实现也可以通过调用外部 API 实现。假设你的函数已经被实现我们需要向 LLM 描述这个函数函数描述的必备要素函数名函数的功能描述函数的请求参数说明函数的响应参数说明可选「查询最近天气」的函数描述typefunctionfunctionnameget_n_day_weather_forecastdescription获取最近n天的天气预报parameterstypeobjectpropertieslocationtypestringdescription城市或镇区 如深圳市南山区formattypestringenumcelsiusfahrenheitdescription要使用的温度单位摄氏度 or 华氏度num_daystypeintegerdescription预测天数requiredlocationformatnum_days调用 LLM 获得函数的请求参数Function Calling 是通过请求 LLM 的 chat API 实现的在支持 Function Calling 模型的 chat API 参数中会有一个 functions 参数 (或 tools不同 LLM 的参数会有所不同) 通过传入这个参数大模型则会知道拥有哪些参数可供使用。并且会根据用户的输入推理出应该调用哪些函数并将自然语言转成函数的请求参数返回给请求方。下面以 OpenAI 的 SDK 举例fromimportdef chat_completion_request(messages, toolsNone, tool_choiceNone, modelgpt-3.5-turbo):tryreturnexceptasUnable to generate ChatCompletion responsefException: {e}returnif__main__rolesystemcontent不要假设将哪些值输入到函数中。如果用户请求不明确请要求澄清roleusercontent未来5天深圳南山区的天气怎么样0回复LLM 将会返回get_n_day_weather_forecast函数的调用参数:回复 [ChatCompletionMessageToolCall(idcall_7qGdyUEWp34ihubinIUCTXyH, functionFunction(arguments{location:深圳市南山区,format:celsius,num_days:5}, nameget_n_day_weather_forecast), typefunction)] // 格式化看看chat_response.choices[0].message.tool_calls: [ { id: call_7qGdyUEWp34ihubinIUCTXyH, function: { arguments: { location: 深圳市南山区, format: celsius, num_days: 5 }, name: get_n_day_weather_forecast }, type: function } ]调用函数调用方获得 LLM 返回的函数调用信息函数名称和调用参数后自行调用函数并得到函数执行的响应。如果有需要还可以把函数执行的响应追加到 chat API 的对话中传给 LLM让 LLM 组织成自然语言回复用户。forinfunction tool_call.function.name arguments_list json.loads(tool_call.function.arguments) function_to_call globals().get(function) result function_to_call(**arguments_list) print( function ) print(result) # 把函数调用结果加入到对话历史中 messages.append( { tool_call_id: tool_call.id, # 用于标识函数调用的 ID role: user, name: function, content: 函数执行结果为: str(result) } )# 函数执行结果传给LLM组织成自然语言回复用户chat_response chat_completion_request( messages, toolstools)print(回复)print(chat_response.choices[0].message.content)执行结果:date2023-04-01location深圳市南山区temperature20°Cdescription晴朗date2023-04-02location深圳市南山区temperature21°Cdescription多云date2023-04-03location深圳市南山区temperature22°Cdescription晴朗date2023-04-04location深圳市南山区temperature23°Cdescription多云date2023-04-05location深圳市南山区temperature24°Cdescription晴朗541204221432244234524智能体的开发框架现在2024 年 5 月如果你想要开发一个 AI 智能体已经比大模型爆发的初期方便太多了随着 AI 应用需求的持续火热智能体框架层出不穷。智能体开发框架会抽象和封装那些被高频使用的模块如记忆能力、规划能力、RAG 能力、大模型调用等。使用智能体框架可让帮助你快速搭建智能体。根据 [awesome-ai-agents] 的整理无论是开源的还是闭源的智能体应用框架在各个领域比如自定义智能体、编码、研究、数据分析、多智能体等等都有比较有代表性的产品可供选择。图10上文曾使用到[MetaGPT]MetaGPT 是一个多智能体框架多智能体框架可以帮你开发一个由多个不同职责的智能体组合起来的多智能体。举个例子如果我们想开发一个多智能体软件团队该软件团队可以根据用户需求交付代码其内部会通过测试代码、评审代码来提升代码质量。该多智能体将包含开发coder、测试tester、评审人reviewer这三个不同职责的智能体他们各司其职互相协作完成任务。下图的左侧是多智能体的协作流程右侧是单智能体的工作流程。图11展望随着大模型的百花齐放LLM 会支持更长的上下文、更大的参数规模其推理能力也会愈发强大。因此基于大模型搭建的智能体AI Agent的能力边界也在不断突破。通过智能体技术我们可以创建各种各样的 AI 应用比如Copilot、DB-GPT 等等一些 AI 应用已经成为工作生活中不可缺少的存在。相信 AI 应用的将会快速全面地重构我们曾经习以为常的软件形态和交互方式以及提升人类的生产效率。大模型未来如何发展普通人如何抓住AI大模型的风口※领取方式在文末为什么要学习大模型——时代浪潮已至随着AI技术飞速发展大模型的应用已从理论走向大规模落地渗透到社会经济的方方面面。技术能力上其强大的数据处理与模式识别能力正在重塑自然语言处理、计算机视觉等领域。行业应用上开源人工智能大模型已走出实验室广泛落地于医疗、金融、制造等众多行业。尤其在金融、企业服务、制造和法律领域应用占比已超过30%正在创造实实在在的价值。未来大模型行业竞争格局以及市场规模分析预测:同时AI大模型技术的爆发直接催生了产业链上一批高薪新职业相关岗位需求井喷AI浪潮已至对技术人而言学习大模型不再是选择而是避免被淘汰的必然。这关乎你的未来刻不容缓那么我们如何学习AI大模型呢在一线互联网企业工作十余年里我指导过不少同行后辈经常会收到一些问题我是小白学习大模型该从哪里入手呢我自学没有方向怎么办这个地方我不会啊。如果你也有类似的经历一定要继续看下去这些问题也不是三言两语啊就能讲明白的。所以呢这份精心整理的AI大模型学习资料我整理好了免费分享只希望它能用在正道上帮助真正想提升自己的朋友。让我们一起用技术做点酷事ps:微信扫描即可获取加上后我将逐一发送资料与志同道合者共勉真诚无偿分享适学人群我们的课程体系专为以下三类人群精心设计AI领域起航的应届毕业生提供系统化的学习路径与丰富的实战项目助你从零开始牢牢掌握大模型核心技术为职业生涯奠定坚实基础。跨界转型的零基础人群聚焦于AI应用场景通过低代码工具让你轻松实现“AI行业”的融合创新无需深奥的编程基础也能拥抱AI时代。寻求突破瓶颈的传统开发者如Java/前端等将带你深入Transformer架构与LangChain框架助你成功转型为备受市场青睐的AI全栈工程师实现职业价值的跃升。※大模型全套学习资料展示通过与MoPaaS魔泊云的强强联合我们的课程实现了质的飞跃。我们持续优化课程架构并新增了多项贴合产业需求的前沿技术实践确保你能获得更系统、更实战、更落地的大模型工程化能力从容应对真实业务挑战。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。01 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。希望这份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通微信扫描下方二维码即可~本教程比较珍贵仅限大家自行学习不要传播更严禁商用02 大模型学习书籍文档新手必备的权威大模型学习PDF书单来了全是一系列由领域内的顶尖专家撰写的大模型技术的书籍和学习文档电子版从基础理论到实战应用硬核到不行※真免费真有用错过这次拍大腿03 AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。04 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。05 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。06 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点由于篇幅有限只展示部分资料并且还在持续更新中…ps:微信扫描即可获取加上后我将逐一发送资料与志同道合者共勉真诚无偿分享最后祝大家学习顺利抓住机遇共创美好未来

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询