2026/4/18 13:52:36
网站建设
项目流程
一站式网站建设用途,用ps如何做模板下载网站,如何与导航网站做友情链接,电商网站开发平台用什么人开发智东西5月28日报道#xff0c;近日#xff0c;来自美国康奈尔大学等高校研究团队的一篇智能体研究综述论文爆火出圈#xff0c;相关推文在社交媒体平台X上收获超70万阅读量#xff0c;过万收藏。这篇长达32页的综述#xff0c;深度分析了Agent#xff08;智能体#xff…智东西5月28日报道近日来自美国康奈尔大学等高校研究团队的一篇智能体研究综述论文爆火出圈相关推文在社交媒体平台X上收获超70万阅读量过万收藏。这篇长达32页的综述深度分析了Agent智能体研究中最容易混淆的一组核心概念——AI Agents和Agentic AI并讨论了智能体技术发展过程中几大堵点问题的技术解决思路。该团队认为AI Agents与Agentic AI存在本质区别AI Agents是以大模型为基础、执行特定任务的自主体更适用于单一任务的自动化处理而Agentic AI是由多个协作智能体组成的系统具备更强大的复杂任务拆解、自主决策和多步骤协同能力更接近人类的组织式智能。从场景来看AI Agents的典型应用包括客服自动化、邮件分类、日程助手等等。Agentic AI的典型应用包括多智能体研究助手、智能机器人协作、游戏中的多角色NPC协同等。作为Agentic AI系统的组成模块AI Agents仍面临幻觉、推理深度有限、无因果建模、上下文窗口受限等挑战。Agentic AI系统则需要解决智能体间的协同失败、错误传播和安全风险。为解决上述问题开发者可以引入如RAG检索增强生成、因果建模、多智能体记忆架构如向量记忆与更强的规划机制如思维树Tree of Thoughts。未来AI Agents将通过模块化设计和智能能力的提升逐步演变为具备**“主动智能”的智能体Agentic AI的多智能体协作框架则会进一步成熟与精细化形成具备高度组织能力的“系统智能”**。01*.GenAI奠定现代AI Agents基础执行能力依赖外部组件研究团队在文章中首先探讨了AI Agents的定义与核心特征。AI Agents是指能够在限定数字环境中自主感知、理解输入、并基于目标执行任务的软件实体。它们超越传统自动化脚本不再依赖固定流程而具备一定程度的环境适应与智能行为常用于信息检索、客服自动化、日程管理等实际场景。AI Agents具有三大核心特征1自主性Autonomy具备在部署后独立运作的能力人类干预较少支持大规模自动化。2任务专一性Task-Specificity通常专注于单一、明确的任务如邮件分类、数据库查询等便于优化效率与可解释性。3反应性与适应性Reactivity Adaptation能够对用户指令或环境状态作出动态响应有些系统甚至能通过反馈机制逐步优化行为。**现代AI Agents的核心通常是大语言模型LLM和大图像模型LIM。**其中大语言模型主要支持AI Agents的自然语言理解、推理、计划和响应生成是AI Agents“思考”的基础。诸如CLIP和BLIP-2等大图像模型使AI Agents具备视觉感知能力广泛应用于机器人、自动驾驶、内容审核等场景。这些模型通常通过API调用方式接入使得开发者无需从零训练模型即可构建AI Agents。文章中用农业无人机的案例展现了AI Agents感知、推理与行动三位一体的运作方式。AI Agents可通过图像识别功能识别果园中的病果或坏枝并在无人干预的情况下触发报警或处理机制。虽然生成式AI模型为现代AI Agents奠定了技术基础但其仍然存在重要局限例如主动性或目标意识差、无持续记忆与状态更新能力、无法直接与外部系统交互等。为弥补生成式AI的不足AI Agents引入了工具调用Tool-Use、函数执行、上下文记忆、任务规划等模块演化成具备初步“认知结构”的系统例如AutoGPT、LangChain等。这标志着系统架构从“内容生成”过渡到“任务执行”是Agentic AI发展的基础步骤。如今的AI Agents通常由四个主要子系统构成感知、推理、行动和学习。感知模块负责接收来自用户如自然语言提示词或外部系统如API、文件上传、传感器数据流的输入信号并将其预处理为智能体推理模块可以理解的格式。知识表征与推理KRR模块是智能的核心模块负责对输入数据应用符号、统计或混合逻辑进行处理。行动选择与执行模块将推理得出的决策转换为外部行动如发送信息、更新数据库、调用API或生成结构化输出。AI Agents还具备基础的学习与适应能力如启发式参数调整或基于历史的上下文保留。AI Agents的定制化通常通过领域特定的提示工程、规则注入或工作流模板实现它与硬编码的自动化脚本的区别在于有上下文感知的决策能力。以ReAct系统为例其采用推理与行动的迭代框架使智能体在执行前能进行内部“思考”。02.AI Agent可扩展性有限Agentic AI成下一代AI基础设施尽管AI Agents已经在自动化特定任务方面取得了突破但这类系统在复杂、多步骤或协作场景中的可扩展性受到限制。这些限制最终催生了更先进的范式——Agentic AI。从定义上来看Agentic AI系统由多个AI Agents组成Agentic AI系统的自主性要高于单个Agent能够管理多步骤的复杂任务并处理需要协作的任务。Agentic AI还涉及多智能体之间的信息共享与AI Agents相比能够在更广泛的任务和环境中进行学习和适应。Agentic AI系统继承了AI Agents的模块化结构但在此基础上引入了分布式智能、智能体间通信和递归规划等增强能力。文献中总结了多项关键架构改进这些改进构成了Agentic AI相较于AI Agents的本质区别1专责智能体协作体系Ensemble of Specialized AgentsAgentic AI不再是单一智能体运行而是由多个专责智能体组成每个负责不同功能如摘要、检索、规划等。这些智能体通过消息队列、黑板机制或共享内存等方式进行通信。例如MetaGPT采用模拟公司部门如CEO、CTO、工程师角色的方式构建智能体角色模块化、可复用、职责清晰。2高级推理与规划能力Advanced Reasoning and PlanningAgentic AI系统内嵌递归推理机制如ReAct、思维链Chain-of-Thought, CoT和思维树Tree of Thoughts等框架。这些机制允许智能体将复杂任务分解为多个推理阶段评估中间结果并动态调整行动计划从而提升系统应对不确定性或任务失败的能力。3持久化记忆架构Persistent Memory Architectures与传统智能体不同Agentic AI具备持久记忆子系统能够在多个任务周期或智能体会话间保留知识。记忆类型包括情景记忆记录任务相关的交互历史、语义记忆长期事实或结构化数据以及向量记忆用于检索增强生成RAG。例如AutoGen智能体使用草稿本记录中间计算结果支持任务的逐步推进。4编排层 / 元智能体Orchestration Layers / Meta-AgentsAgentic AI的一项关键创新是引入了编排器或元智能体负责协调各子智能体的生命周期、管理依赖关系、分配角色并解决冲突。这类元智能体通常包含任务管理器、评估器或协调者角色。例如在ChatDev系统中一个虚拟CEO元智能体将子任务分配给不同部门智能体并整合它们的输出形成统一的策略响应。这些架构方面的调整使Agentic AI能够胜任需要持续上下文、多智能协作、多模态协调及策略适应的复杂任务场景。典型应用包括多个智能体协同完成检索、摘要、文稿撰写的研究助理如AutoGen流水线或监控物流、供应商绩效与动态定价模型的智能供应链系统。研究团队认为Agentic AI正在成为下一代AI基础设施其能力不仅限于执行预设流程更能构建、调整和管理复杂目标实现最小人工干预下的自主运行。03.AI Agents继承大模型短板Agentic AI缺乏统一标准在当下令人眼花缭乱的智能体应用中究竟哪些属于AI Agents又有哪些属于Agentic AI呢这篇综述为我们归纳了AI Agents与Agentic AI的典型应用场景。AI Agents目前广泛应用于客服自动化、企业内部搜索、电子邮件分类与优先级管理、内容推荐以及日程安排等场景。广为人知的AI Agents包括Manus、NotebookLM、 ChatGPT深度搜索等。此外智能营销产品Salesforce Einstein、智能协作与内容生成平台Notion AI、个性化内容推荐系统如亚马逊、YouTube、Spotify的推荐系统和日程安排助手Reclaim AI等也属于AI Agents。▲业内有代表性的AI AgentsAgentic AI具备更高层次的认知和任务协作能力目前的应用包括科研助手、多机器人协调系统、医疗辅助诊断系统、网络安全风险处理系统等。不过无论是从客观的基准测试还是用户的主观体验来看AI Agents和Agentic AI距离无需人类干预的高度自主化系统仍有一定距离。现有的AI Agents主要存在因果推理能力差、幻觉较多、推理深度较浅、知识更新滞后等问题其中部分问题是从大语言模型继承而来的。AI Agents还缺乏自主目标设定能力、反思能力、上下文记忆、持久性控制这些问题导致其在长期规划和故障恢复方面表现不佳。Agentic AI面临的挑战更多出现在智能体的协作环节包括智能体间的错误传播单个子智能体的错误在系统中被层层放大、系统稳定性差等问题。Agentic AI系统的基础研究尚处早期阶段缺乏统一的标准架构、通信协议与可验证机制难以进行跨平台集成与通用化开发可扩展性因此受限。04.从RAG到自我批判架构堵点问题10大解法这篇论文还总结了解决AI Agents与Agentic AI所面临的多样问题的10大解决方案。1检索增强生成RAG通过结合实时数据检索RAG能够减少AI Agents的幻觉问题并扩展其静态知识库。例如在企业搜索和客户支持中RAG可以确保生成的响应基于外部事实。在多Agent系统中RAG作为共享的“事实基础”能确保Agent之间的一致性并减少因上下文不一致导致的错误传播。2工具增强的推理Tool-Augmented ReasoningAI Agents如果能通过调用外部API、运行本地脚本或访问结构化数据库就可以转变为交互式的问题解决者。在多Agent系统中工具增强的推理让每个Agent可以根据其角色调用特定的API支持更清晰的行为边界并减少任务交接中的模糊性。3Agent行为循环Agentic LoopAgent行为循环指的是推理、行动、观察这三者间的迭代。通过引入迭代循环Agent可实现更谨慎、更适应上下文的行为。例如Agent在生成摘要之前会验证检索到的数据。在多Agent系统中这种循环对于协作一致性至关重要。每个Agent的观察结果需要与其他Agent的输出进行协调。要实现这一点共享内存和一致的日志记录是关键。4记忆架构Memory Architectures记忆架构的升级可以帮助AI Agents解决长期规划和会话连续性的问题。例如Agents可以回忆之前的动作和反馈从而实现个性化和适应性决策。Agentic AI需要更复杂的记忆模型来管理分布式状态。此类模型允许每个Agent可以维护本地内存同时访问共享的全局内存以支持长期的系统级规划。目前研究者正探索情景记忆Episodic Memory、语义记忆Semantic Memory和向量记忆VectorMemory等不同架构。5**角色专业化的多Agent编排Multi-Agent Orchestration with Role Specialization**即使在单Agent系统中开发者也可以通过将任务分解为子组件例如规划者、总结者并进行模拟分隔推理来实现轻量级的编排。在Agentic AI系统中编排是一项核心技术。元Agent或编排者在专业化的Agent之间分配任务每个Agent都有不同的能力。6**自反思与自我批判机制Reflexive and Self-Critique Mechanisms**引入自我评估能力后Agent在完成任务时可以使用二次推理过程来审查自己的输出从而提高鲁棒性和减少错误率。这项能力也可以扩展到Agent之间的相互评估。例如一个验证Agent可以审计总结Agent的工作确保协作质量控制。7程序化提示工程管线Programmatic Prompt Engineering Pipelines自动化任务模板、上下文填充和检索增强变量等技术可以减少手动调整提示词的不稳定性。这些动态提示词可以根据任务类型、AI Agents角色或用户查询进行结构化。在Agentic AI系统中每个Agent类型例如规划者、检索者、总结者可以根据其功能生成或使用结构化的提示词。8因果建模与基于模拟的规划Causal Modeling and Simulation-Based Planning通过嵌入因果推断AI Agents将能够区分相关性和因果关系从而更稳健地进行干预模拟和规划。而在Agentic AI系统中因果推理对于安全协调和错误恢复至关重要。9监控、审计与可解释性管线Monitoring, Auditing, and Explainability Pipelines通过记录提示词、工具调用、内存更新和输出日志系统可以对AI Agents进行事后分析和性能调整。这些记录有助于开发人员跟踪故障、优化行为并确保符合使用指南。在Agentic AI系统中日志和可解释性同样至关重要。审计跟踪对于识别哪个Agent导致错误以及在什么条件下发生错误是十分关键的。10治理感知架构Governance-Aware Architectures开发者可以为AI Agents引入基于角色的访问控制、沙箱和身份解析以确保Agent在其范围内行动并且其决策可以被审计或撤销。在Agentic AI系统中这一治理感知架构必须扩展到角色、Agent和工作流中角色隔离可以防止AI Agents超出权限而责任机制可以为决策分配责任并跟踪因果关系。05*.结语AI Agents与Agentic AI的未来从被动响应到自主进化研究团队认为未来AI Agents的发展将朝着更加自主化、智能化的方向演进。它们不再局限于被动响应而是能基于上下文和目标主动推理具备主动智能Proactive Intelligence。通过深度集成外部工具Tool Integration和因果推理能力Causal ReasoningAI Agents可以更高效地处理复杂问题。持续学习Continuous Learning机制让它们能不断优化自身表现而信任与安全Trust Safety机制的完善则确保其输出可靠、无偏见。与此同时Agentic AI将推动多智能体扩展Multi-Agent Scaling和统一编排Unified Orchestration让多个AI Agents高效协作解决更宏大的挑战。持久记忆Persistent Memory和模拟规划Simulation Planning让AI具备长期任务管理能力而伦理治理Ethical Governance则确保其发展符合人类价值观。文章还特别提到了清华大学、北京通用人工智能研究院与宾夕法尼亚州立大学提出的的AZR绝对零数据推理框架的突破。这一框架有望让AI摆脱对人类标注数据的依赖通过自我生成任务和验证反馈实现完全自主进化。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】