dede网站站内推广方法建设通小程序
2026/4/18 16:31:37 网站建设 项目流程
dede网站站内推广方法,建设通小程序,青海省建设厅网站首页,免费高清网站推荐这篇笔记深入解读了 Weaviate 出品的《Context Engineering》电子书。在大模型应用开发中#xff0c;仅仅依赖 Prompt Engineering#xff08;提示词工程#xff09;往往是不够的#xff0c;如何构建一个能够根据上下文动态调整、拥有记忆并能使用工具的系统#xff0c;才…这篇笔记深入解读了 Weaviate 出品的《Context Engineering》电子书。在大模型应用开发中仅仅依赖 Prompt Engineering提示词工程往往是不够的如何构建一个能够根据上下文动态调整、拥有记忆并能使用工具的系统才是打造高质量 AI 应用的关键。这就是 Context Engineering上下文工程。以下是基于原书内容的深度解读与笔记。PDF地址https://weaviate.io/ebooks/the-context-engineering-guide大型语言模型LLM的能力令人印象深刻但开发者很快就会发现一个问题模型本身很强大但它是孤立的。它无法访问私有文档不知道昨天发生的事甚至会在不知道答案时自信地编造内容。问题的根源在于上下文窗口Context Window——模型的工作记忆空间是有限的。就像白板一样一旦填满旧信息就会被擦除重要细节可能丢失。单靠写更好的提示词解决不了这个根本限制需要在模型周围构建一个完整的系统。这就是Context Engineering上下文工程。Context Engineering 的六大核心组件Context Engineering 是一门设计架构的学科它能在正确的时间向 LLM 提供正确的信息。这不是改变模型本身而是构建连接模型与外部世界的桥梁。1. Agents智能体决策大脑协调何时以及如何使用信息。2. Query Augmentation查询增强将混乱、模糊的用户请求转化为精确、机器可读的意图。3. Retrieval检索连接 LLM 与特定文档和知识库的桥梁。4. Prompting Techniques提示技术提供清晰有效的指令来引导模型推理的技巧。5. Memory记忆赋予应用历史感和从交互中学习的能力。6. Tools工具让应用能够采取直接行动并与实时数据源交互。Agents动态决策的协调者静态的检索-生成流程在简单的 RAG 场景下还行但一旦任务需要判断、适应或多步推理这种方式就不够用了。什么是 AgentAI Agent 是一个能够动态决策信息流根据学到的内容决定下一步做什么跨多次交互维护状态记住做过什么用历史信息指导未来决策根据结果调整方法一种策略不行就尝试不同的方法自适应使用工具从可用工具中选择并以未明确编程的方式组合使用上下文窗口的挑战LLM 的信息容量有限上下文窗口一次只能容纳这么多信息。每次 Agent 处理信息时都需要决定哪些信息应该保留在上下文窗口中哪些应该存储在外部并在需要时检索哪些可以总结或压缩以节省空间为推理和规划预留多少空间更大的上下文窗口并不能解决问题反而会引入新的故障模式常见的上下文错误类型Context Poisoning上下文污染错误或幻觉信息进入上下文Agent 重复使用这些上下文错误会持续并复合Context Distraction上下文分散Agent 被过多的历史信息负担过度依赖重复过去的行为而不是重新推理Context Confusion上下文混淆不相关的工具或文档挤满上下文分散模型注意力导致使用错误的工具或指令Context Clash上下文冲突上下文中的矛盾信息误导 Agent使其陷入冲突的假设之间Agent 的策略和任务Agent 能够有效协调上下文系统因为它们能够动态推理和决策。常见任务包括Context Summarization上下文总结定期将累积的历史压缩成摘要减轻负担同时保留关键知识Quality Validation质量验证检查检索到的信息是否一致和有用Context Pruning上下文修剪主动删除不相关或过时的上下文Adaptive Retrieval Strategies自适应检索策略重新表述查询、切换知识库或改变分块策略Context Offloading上下文卸载将细节存储在外部仅在需要时检索Dynamic Tool Selection动态工具选择只加载与任务相关的工具减少混淆Multi-Source Synthesis多源综合结合多个来源的信息解决冲突产生连贯的答案Agent 在上下文工程中的定位Agent 充当上下文工程系统中的协调者。它们不会取代其他技术而是智能地编排这些技术。Query Augmentation理解用户意图上下文工程最重要的步骤之一是如何准备和呈现用户的查询。如果不知道用户到底在问什么LLM 就无法提供准确的响应。两个主要问题用户交互往往不理想现实世界中用户与聊天机器人的交互可能不清楚、混乱、不完整不同管道部分需要不同的查询格式LLM 能理解的问题可能不是搜索向量数据库的最佳格式Query Rewriting查询重写将原始用户查询转换为更有效的检索版本。这种技术通过以下方式工作重构不清楚的问题将模糊或表述不当的用户输入转换为精确、信息密集的术语移除上下文消除可能混淆检索过程的不相关信息关键词增强引入常用术语增加匹配相关文档的可能性Query Expansion查询扩展从单个用户输入生成多个相关查询改善检索结果。特别适用于查询模糊、表述不当或需要更广泛覆盖的情况。挑战包括Query Drift查询漂移扩展的查询可能偏离用户的原始意图Over-Expansion过度扩展添加太多术语会降低精度Computational Overhead计算开销处理多个查询会增加系统延迟Query Decomposition查询分解将复杂的多方面问题分解为更简单、更集中的子查询可以独立处理。通常包括两个主要阶段分解阶段LLM 分析原始复杂查询并将其分解为更小、更集中的子查询处理阶段每个子查询独立通过检索管道处理允许更精确地匹配相关文档Query Agents查询智能体最先进的查询增强形式使用 AI Agent 智能处理整个查询处理管道。Query Agent 的能力包括动态查询构建根据对用户意图和数据模式的理解按需构建查询多集合路由理解所有集合的结构智能决定查询哪些数据集合评估在原始用户查询的上下文中评估检索到的信息上下文感知维护对话上下文以处理后续问题Retrieval连接知识的桥梁LLM 的好坏取决于它能访问的信息。虽然 LLM 在海量数据集上训练但它们缺乏对特定私有文档和训练完成后创建的任何信息的了解。分块策略指南分块Chunking是检索系统性能最重要的决策。这是将大型文档分解为更小、可管理部分的过程。外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传设计分块策略时必须平衡两个相互竞争的优先级检索精度Retrieval Precision分块需要小而集中于单一想法创建独特、精确的嵌入上下文丰富性Contextual Richness分块必须足够大且自包含才能被理解简单分块技术Fixed-Size Chunking固定大小分块 最简单的方法将文本分割成预定大小的分块例如 512 个 token。Recursive Chunking递归分块 使用分隔符的优先级列表如段落、句子、单词分割文本尊重文档的自然结构。Document-Based Chunking基于文档的分块 使用文档的固有结构例如按 Markdown 的标题、HTML 的标签或源代码的函数分割。高级分块技术Semantic Chunking语义分块 基于含义分割文本将语义相关的句子组合在一起。LLM-Based Chunking基于 LLM 的分块 使用大型语言模型智能处理文档并生成语义连贯的分块。Agentic Chunking智能体分块 AI Agent 动态分析文档的结构和内容为特定文档选择最佳分块策略。Hierarchical Chunking层次分块 在不同细节级别创建多层分块。Late Chunking延迟分块 与标准流程的架构模式相反先嵌入整个文档然后再按token进行关联分块。Pre-Chunking vs Post-ChunkingPre-Chunking预分块 最常见的方法所有数据处理都在前期离线完成。✅ 优点查询时检索速度极快❌ 缺点分块策略固定改变需要重新处理整个数据集Post-Chunking后分块 先进的实时替代方案分块发生在文档检索之后。✅ 优点高度灵活可以创建特定于用户查询上下文的动态分块策略❌ 缺点增加延迟需要更复杂的基础设施Prompting Techniques引导模型推理提示工程是设计、完善和优化给 LLM 的输入提示以获得期望输出的实践。措辞方式可以直接影响响应的准确性、有用性和清晰度。经典提示技术Chain of Thought思维链 要求模型逐步思考将复杂推理分解为中间步骤。Few-Shot Prompting少样本提示 在上下文窗口中提供几个示例演示想要的输出类型或正确答案。高级提示策略Tree of Thoughts思维树 在 CoT 基础上构建指示模型并行探索和评估多个推理路径。ReAct Prompting 结合 CoT 和 Agent使模型能够动态地推理和行动。工具使用提示当 LLM 与外部工具交互时清晰的提示确保正确的工具选择和使用。关键要素定义参数和执行条件提供少样本示例明确何时使用工具说明如何使用工具专业提示如何编写有效的工具描述使用主动动词明确输入参数描述输出提及限制Memory赋予系统记忆在构建 Agent 时记忆不只是一个额外功能——它是赋予 Agent 生命的东西。没有它LLM 只是一个强大但无状态的文本处理器。Andrej Karpathy 提供了完美的类比将 LLM 的上下文窗口比作计算机的 RAM将模型本身比作 CPU。记忆架构Short-Term Memory短期记忆 Agent 的即时工作空间塞进上下文窗口以推动即时决策和推理。Long-Term Memory长期记忆 超越即时上下文窗口将信息存储在外部以便快速检索。包括Episodic Memory情景记忆存储特定事件或过去的交互Semantic Memory语义记忆保存一般知识和事实Hybrid Memory Setup混合记忆设置 大多数现代系统使用混合方法结合短期记忆的速度和长期记忆的深度。有效记忆管理的关键原则修剪和精炼记忆 定期扫描长期存储以删除重复条目、合并相关信息或丢弃过时事实。有选择地存储 实施过滤标准在保存之前评估信息的质量和相关性。根据任务定制架构 没有一刀切的记忆解决方案从最简单的方法开始逐步分层。掌握检索艺术 有效的记忆不在于能存储多少而在于能在正确的时间检索正确的信息。Tools连接外部世界如果说记忆给 Agent 一种自我感那么工具就是赋予它超能力的东西。LLM 本身是出色的对话者和文本处理器但它们生活在一个泡泡里。从提示到行动的演变真正的突破是函数调用Function Calling也叫工具调用。这种能力现在是大多数模型的原生功能允许 LLM 输出包含要调用的函数名称和要使用的参数的结构化 JSON。可能性包括简单工具旅行 Agent 可以使用search_flights工具工具链复杂请求可能需要链接多个工具如find_flights、search_hotels和get_local_events编排挑战给 Agent 一个工具很容易让它可靠、安全、有效地使用该工具才是真正的工作。关键编排步骤Tool Discovery工具发现 Agent 需要知道它有哪些工具可用。Tool Selection and Planning工具选择和规划 面对用户请求时Agent 必须推理是否需要工具。Argument Formulation参数制定 一旦选择了工具Agent 必须弄清楚要传递给它什么参数。Reflection反思 执行工具后输出被反馈到上下文窗口Agent 反思这个输出以决定下一步。工具调用的下一代技术MCP工具使用的演变越来越趋向标准化。Model Context Protocol (MCP)由 Anthropic 在 2024 年底推出提供了一个通用标准来连接 AI 应用与外部数据源和工具。MCP 将传统的 M×N 集成问题M 个应用各自需要为 N 个工具编写自定义代码转变为更简单的 MN 问题。总结从提示者到架构师Context Engineering 不仅仅是提示大型语言模型、构建检索系统或设计 AI 架构。它是构建互联的、动态的系统能够在各种用途和用户中可靠地工作。Context Engineering 由六大核心组件组成Agents作为系统的决策大脑Query Augmentation将混乱的人类请求转化为可操作的意图Retrieval连接模型与事实和知识库Memory赋予系统历史感和学习能力Tools赋予应用与实时数据和 API 交互的能力Prompting Techniques引导模型的推理过程正在从与模型对话的提示者转变为构建模型生活世界的架构师。最好的 AI 系统不是来自更大的模型而是来自更好的工程。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询