2026/4/18 13:14:43
网站建设
项目流程
外包网站公司,个体户营业执照可以网站备案,十堰为企业做网站的单位,互联网备案查询系统前言
–
在AI领域#xff0c;随着大模型的广泛应用#xff0c;如何高效地利用外部知识成为提升模型性能的关键。检索增强生成#xff08;Retrieval-Augmented Generation, 简称RAG#xff09;作为一种结合信息检索与文本生成的技术框架#xff0c;正在迅速成为解决这一问题…前言–在AI领域随着大模型的广泛应用如何高效地利用外部知识成为提升模型性能的关键。检索增强生成Retrieval-Augmented Generation, 简称RAG作为一种结合信息检索与文本生成的技术框架正在迅速成为解决这一问题的重要工具。RAG应用普及促进RAG技术不断演进衍生出多个变体和优化方案如GraphRAG、MultiHop-RAG(多跳RAG、HyDE和RAGFusion等就是目前市场中主流的几个RAG家族成员这些RAG技术优化路线各有侧重适用于不同的应用场景。本文将系统梳理RAG家族的发展脉络深入剖析各版本的核心原理、技术架构及实际应用帮助用户全面理解 RAG生态体系与应用范式。在介绍RAG家族其它成员前我们首先还是回顾一下RAG的基本概念同时也了解一下传统RAG的局限性。传统RAG及其局限性RAG的基本概念RAG技术通过把信息检索与文本生成相结合为大模型提供了一个“开放的知识库”使其能够在回答问题时查阅外部知识。让我们仔细看看 RAG 的三个关键阶段检索在此阶段RAG系统根据用户的查询从外部数据源例如文档或数据库检索相关信息。检索过程可以使用不同的技术来识别最相关的数据例如相似性搜索或数据库查询。然后根据结果与查询的相关性对其进行排序和评分。增强在增强阶段检索到的信息会与原始用户问题以及任何附加说明或上下文相结合。增强后的提示为语言模型生成响应提供了更丰富的上下文。目标是强制模型仅使用这些相关信息来生成准确且有用的输出。生成在最后阶段增强型提示将由大模型处理该大模型仅使用提供的上下文而非依赖其预先训练的知识生成所需格式的答案。该答案还可以链接源信息和其他元数据。通过利用外部知识增强语言模型并利用模型的自然语言理解能力来检索和处理这些信息与仅依赖预先训练的知识的独立语言模型相比RAG系统可以产生更准确、时效性更高、领域属性更强的响应。传统RAG的局限性许多RAG系统统仅依赖于对文本嵌入数值向量表示进行向量搜索以进行信息检索。为了准确捕捉文本的相关性语义源文档通常被分成更小的片段然后嵌入、索引和存储以供检索。然而这种方法有其局限性。由于仅依赖向量搜索响应内容仅限于检索到的块中的文本片段。这可能导致答案不完整或碎片化。例如如果用户询问有关特定产品功能的问题则RAG系统可能会检索提及该产品的块但无法包含提供更全面答案的文档其他部分的相关信息。此外由于向量表示和向量搜索的黑盒特性此类方法无法解释所收集信息的依据。这意味着用户和开发者对于检索某些数据块的原因以及它们对生成响应的贡献了解有限。这种缺乏可解释性可能成为传统RAG系统一个重大缺陷尤其是在可靠性、安全性、合规性至关重要的领域例如医疗保健或金融。为了解决这些缺点市场中的专业团队使用一些新技术来改进RAG流程的不同阶段检索、增强和生成这也是RAG技术深度应用的必然产物。根据专家对RAG领域的研究表明RAG有三个重要的发展阶段简单RAG、高级RAG和模块化RAG在高级RAG应用阶段在简单RAG基础上增加了预检索和后检索支持模块化 RAG系统则包含更复杂的模式需要对用户查询进行流程编排和路由决策设计。这也是RAG技术演进的重要理论支撑。RAG应用的三个阶段GraphRAGGraphRAG基本概念GraphRAG是对RAG方法的增强通过整合知识图谱中存储的结构化领域知识来增强检索借助知识图谱中丰富的连接和语义关系GraphRAG可以克服纯向量RAG的局限性并提供更准确、更易于解释的查询响应。GraphRAG本身并非独立产品而是一种扩展、优化标准RAG的应用模式是知识图谱和RAG系统的结合。GraphRAG基本流程GraphRAG包含一个图形数据库作为发送给大模型的上下文信息的来源如果向大模型提供从较大文档中提取的文本块则可能缺乏大模型深入理解所接收文本块所需的上下文、事实正确性和语言准确性。与向LLM发送纯文本文档块不同GraphRAG还可以向大模型提供结构化实体信息将实体文本描述与其众多属性和关系相结合从而促进LLM获得更深入的洞察。借助 GraphRAG向量数据库中的每条记录都可以具有丰富的上下文表示从而提高特定术语的可理解性从而使大模型能够更好地理解特定主题领域。GraphRAG可以与标准RAG方法结合使用以兼顾两者的优势——将图形表示的结构和准确性与文本内容的海量性相结合。医疗领域GraphRAG应用架构GraphRAG工作原理与RAG类似GraphRAG的流程涉及索引和查询。但在索引阶段GraphRAG通过精心设计的提示和收集检查从文档中提取实体和关系。通过使用大模型GraphRAG可以识别实体名称、类别和描述和关系实体之间的连接以及强度分数例如 1-10。在下一步中通过语义聚类密切相关的节点被分组为称为社区的层次聚类。在查询阶段当用户开始提问时系统会识别实体和关系并将其与图谱索引进行比较从而确定最相关的社区。然后这些社区摘要会被传递给 大模型以获得本地和全局不同级别的中间响应其有用性得分为0到100。最终的全局答案是通过将根据有用性评分的中间响应传递给多阶段Map Reduce方法生成的。由于GraphRAG能够捕捉数据实体之间的关系因此非常适合回答复杂的查询。这被称为增强型上下文理解通常也是除了具有平面数据检索功能的RAG系统之外人们使用知识图谱的主要原因。GraphRAG与RAG系统相比**GraphRAG的准确性和响应质量有所提高有时甚至可提高3 倍**全局和局部摘要功能使 GraphRAG能够比RAG系统更好地与用户意图保持一致。当然GraphRAG在引入知识图谱检索方式后在优化RAG的同时也将带来计算成本的增加以及查询效率的降低具体应用过程中需要客观评估查询效率与准确性之间的平衡。GraphRAG应用类型根据问题的性质、领域和知识图谱中的信息我们可以总结出几种不同的GraphRAG类型1. 图作为内容枢纽图作为内容枢纽Graph as a Content Hub利用图结构节点和边将多源异构数据如文本、图像、业务数据整合为统一关联网络的技术架构。其核心是通过图模型建立跨域数据间的语义或逻辑连接实现数据的动态聚合与智能调度。关键特征节点Node表示实体如用户、产品、文档边Edge表示实体间关系如购买“隶属”“引用”动态关联支持实时更新和跨系统数据融合典型应用企业知识图谱整合CRM、ERP等多系统数据内容推荐系统通过用户-内容交互关系推荐类比说明就像一个大超市的智能货架系统所有商品数据不是胡乱堆放的商品之间用智能感应带连接比如牛奶旁边自动关联饼干、麦片找东西时系统能立即告诉你所有相关商品放在哪。应用案例电商推荐买了手机的人还买了什么疫情流调查找密接者的密接。2. 图作为领域专家图作为领域专家Graph as a Subject Matter Expert将领域知识如行业规则、专家经验建模为图结构使图数据库具备类专家级的语义理解和推理能力。其本质是通过预定义的图模式Graph Schema和规则引擎实现复杂业务逻辑的可计算化。关键特征领域知识嵌入显式定义实体间业务规则如担保→风险传导推理能力支持路径查询、模式匹配等高级操作可解释性决策过程可通过图路径追溯典型应用金融反欺诈识别担保环路、空壳公司网络医疗辅助诊断症状-疾病-药品关联推理类比说明相当于把老师傅的行业经验画成关系地图老中医的经验 → 变成症状-药材-禁忌关系网银行风控专家的经验 → 变成企业-担保-法人风险图谱。应用案例输入症状自动推荐中药配方输入企业名称自动评估贷款风险。3. 图作为数据库图作为数据库Graph as a Database一种以图作为基础、专门优化存储和查询关系的数据管理系统。其采用原生图存储引擎Native Graph Storage直接以节点、边和属性的形式持久化数据区别于关系型数据库的二维表结构。关键特征原生图处理支持索引无关的邻接查询如朋友的朋友高效遍历复杂关系查询时间复杂度可达O(1)灵活模式支持动态增减节点/边类型典型应用社交网络分析好友推荐、社区发现供应链溯源追踪上下游影响路径类比说明最像我们的人际关系网传统数据库比如通讯录只记录每个人的联系方式图数据库会额外记录谁和谁是同学“谁和谁合作过项目”。应用案例查朋友的朋友中谁会修电脑找供应链中断的源头企业。GraphRAG应用场景GraphRAG主要用于需要更高信任级别的应用程序和领域以解决应用场景中的关键业务决策。以下是一些具体的应用场景示例应用场景应用场景说明法律与合规审查和分析合同、案例、法律和法规。投资研究调查组织、人员、竞争对手、市场和趋势。生物技术访问知识图谱以进行药物发现和重新利用、临床试验和研究。业务流程支持将各种业务数据源集成到组织的统一视图中。供应链对产品和生产流程的风险评估、合规性和可持续性进行调查。欺诈检测识别和防止洗钱、保险欺诈和其他欺诈活动。调查性新闻揭示新闻报道和调查中大量数据的联系和模式。GraphRAG 增强了大模型生成更准确、更相关且更符合语境的响应能力。这项技术不仅提升了输出的整体质量还扩展了大模型处理复杂且细致入微的查询的能力。GraphRAG为从高级聊天机器人到复杂数据分析工具等各种应用开辟了新的RAG优化思路。GraphRAG应用落地开源的RAGFlow作为新一代检索增强生成框架从v0.16.0开始已经支持在知识库上构建知识图谱让您能够跨知识库中的多个文件构建统一的图谱当新上传的文件开始解析时生成的图谱将自动更新实际上可以理解为RAGFlow已经对GraphRAG能力进行了集成我们可以通过RAGFlow快速体验GraphRAG的应用效果。RAGFlow中知识图谱应用RAGFlow在数据提取和索引之间添加了知识图谱构建步骤如下所示。此步骤会根据您指定的分块方法生成的现有块创建额外的块。在RAG检索过程中融合知识图谱对于涉及嵌套逻辑的多跳问答尤其有用。当您针对包含复杂实体和关系的书籍或作品进行问答时它们的表现优于传统的提取方法。MultiHop-RAGMultiHop-RAG基本概念MultiHop-RAG即多跳RAG是传统检索增强生成技术的进阶版本是一种通过多轮迭代检索与推理解决复杂问题的技术框架。其核心在于将需要多步逻辑推理的查询分解为若干子问题依次检索相关文档并动态重构查询最终综合多轮检索结果生成准确答案。在现实世界的问答场景中许多问题并非通过单一信息片段就能直接回答。它们往往需要用户或系统在多个文档、多个事实之间进行“跳跃式”的推理和信息整合才能得出最终答案。这类问题被称为多跳问题MultiHop Questions 。单跳问题VS多跳问题例如我们询问“发明iPhone的公司其现任CEO是谁”这个问题需要首先识别“发明iPhone的公司”是“苹果公司” 然后进一步查询“苹果公司”的“现任CEO”是谁。这涉及至少两步的信息检索和推理。传统RAG系统主要依赖于单次检索和生成擅长处理基于单一或少量文档片段即可回答的简单问题。然而面对多跳问题时传统RAG的局限性就暴露无遗信息分散多跳问题的答案通常分散在不同的文档或知识法一次性召回所有必要的证据。推理链缺失即使检索到所有相关信息传统RAG也缺乏明确的机制来引导LLM按照逻辑顺序进行多步推理将分散的信息连接起来。上下文窗文窗口限制为了回答多跳问题可能需要将大量相关但分散的信息填充到LLM的上下口中这容易超出LLM的输入长度限制或导致LLM在长文本中“迷失”关键信息。评估难度评估多跳RAG系统的性能比评估传统RAG更具挑战性因为不仅要看最终答案的准确性还要考察推理过程的正确性和完整性。为了应对这些挑战MultiHop-RAG技术应运而生旨在赋予RAG系统处理复杂、多步推理问题的能力。MultiHop-RAG工作原理MultiHop-RAG的核心思想是分治策略将复杂问题分解为多个子问题通过检索-生成-再检索的循环逐步逼近答案。MultiHop-RAG基本流程MultiHop-RAG实现了一个多步骤检索系统随着系统接收到更多信息其查询过程也会逐渐变得复杂。主要技术实现机制如下1. 迭代检索机制MultiHop-RAG通过在文档检索中使用迭代系统来改进RAGMultiHop-RAG主要采用以下步骤以实现迭代检索机制第一步获取初始文档集第二步获取相关实体并重新表述问题第三步根据细化查询获取其他文档第四步利用大模型构建最终答案该迭代文档检索计划保证提供与多跳查询上下文相关的系统知识。2. 查询扩展和重构动态查询重构是MultiHop-RAG的基石之一。从模型的角度并根据所包含的信息重新改写查询。保证下一个检索到的部分包含尚未获得的知识。应用大语言模型例如GPT或DeepSeek以改进查询。3. 证据链接和答案综合MultiHop-RAG提供额外的功能包括MultiHop-RAG链接来自不同来源的证据。确保检索到的文档在逻辑上相互关联。借助多跳查询检索到的不同文档并不能保证包含单一上下文。最终提供的答案是通过加权证据逻辑构建的以防止出现幻觉。4. 知识图谱辅助结构化推理如前所述的GraphRAG其知识图谱的结构化特性天然适合进行多跳推理。通过在图谱上进行路径搜索和关系遍历可以高效地发现实体之间的多跳关联并提取出推理链上的关键信息。这使得LLM能够基于更清晰的逻辑结构进行生成。结合文本检索知识图谱可以作为辅助引导文本检索。例如先在知识图谱中找到相关实体和关系再用这些信息来增强或过滤文本检索的结果。5. 多跳数据集与评估为了验证MultiHop-RAG的效果我们需要准备专门的多跳问答数据集这些数据集包含复杂的查询、多跳的真实答案以及支撑证据用于评估RAG系统从多个来源检索和推理信息的能力。这些数据集的构建通常需要半自动化甚至人工标注以确保数据质量和推理链的完整性。评估指标不仅包括答案的准确性还可能包括检索到的证据的完整性、推理路径的正确性等。MultiHop-RAG查询的类型MultiHop-RAG查询可分为四种不同类型以实现不同的推理模式1. 推理需要整合来自多个来源的信息得出结论。例如“根据中国和美国近期宣布的气候政策预计哪个国家将率先实现碳中和”2. 比较涉及比较不同文档中的属性或特征。例如“谷歌、苹果和微软三家公司中哪家公司在2023年第三季度财报中报告的利润率最高”3. 时间性关注不同文档中描述的事件之间的时间顺序或时间关系。例如“美联储是在2023年11月通胀数据发布之前还是之后宣布利率调整的”4.空结果看似可回答但在语料库中缺乏足够支持证据的查询用于测试系统识别信息不足的能力。例如“虚构的HarmonyApple智能手机在发布会上哪些技术获得广泛好评”每种查询类型都对RAG系统的检索和生成组件提出了独特的挑战从而提供了一个全面的评估框架。当前的嵌入模型难以捕捉多跳检索所需的复杂关系。研究结果表明检索是当前RAG系统处理多跳查询时的一个主要瓶颈。MultiHop-RAG应用场景MultiHop-RAG主要适用于需要多步关联推理的复杂信息需求例如复杂事实性问答、企业级知识推理、金融风控、学术与科研、医疗诊断辅助、法律与合规、技术选型判断标准。应用场景应用场景说明智能客服与技术支持处理用户提出的复杂问题这些问题可能涉及产品多个模块的功能、故障排查的多个步骤或跨部门的协作流程。学术研究帮助研究人员从海量论文中提取和整合分散的知识点回答需要跨学科、跨领域知识的问题帮助学习者和研究人员获得多步骤问题的正确答案。商业智能与决策支持分析市场报告、财务数据、供应链信息等回答需要多维度数据整合和逻辑推理的商业问题。法律与合规在查阅多份法律文件后收集监管或判例法信息。医疗保健查询连接症状、疾病和治疗历史以进行人工智能辅助诊断。教育与学习构建智能辅导系统帮助学生理解复杂概念回答需要多步思考和知识关联的问题。在具体RAG落地应用过程中是否采用MultiHop-RAG技术的判断标准可以初步遵循当满足以下至少两条时应优先选择多跳RAG。问题需要关联两个以上的独立信息源答案依赖中间推理步骤无法直接检索存在潜在的隐藏关系如股权控制、学术合作需审计推理过程与证据链如法律、医疗场景MultiHop-RAG未来展望根据目前的研究测试与应用效果跟踪以下几点是多跳RAG系统需要改进的几个关键领域检索增强当前基于嵌入的检索方法在处理多跳查询方面存在根本性困难。未来的研究可以探索查询分解策略将复杂查询分解为更简单的子查询。推理能力即使拥有完美的检索能力大模型仍难以应对复杂的推理任务。提升模型跨文档关联信息的能力仍然至关重要。查询特定优化不同查询类型的性能差异很大这表明不同的推理模式可能需要专门的方法。基于代理的方法多跳查询的复杂性可能需要更复杂的基于代理的系统该系统可以跨多个检索步骤主动搜索和连接信息。MultiHop-RAG的引入为RAG优化提供了可行的技术路线让我们能够搭建处理现实复杂查询的RAG系统。通过解决已发现的局限性未来的RAG系统可以更好地满足现实世界中经常需要多跳推理的复杂检索与查询任务。HyDEHyDE基本概念HyDE假设文档嵌入是一种信息检索技术通过生成代表查询理想答案的“假设”文档来改进搜索结果。HyDE并非直接将用户的查询与现有文档匹配而是首先使用语言模型创建一个能够回答查询的合成文档。然后该合成文档被转换为嵌入数值向量并与数据库中真实文档的嵌入进行比较。最接近的匹配结果将作为结果返回。其核心思想是假设文档比原始查询文本更能捕捉查询的意图和上下文从而实现更准确的检索。HyDE与传统RAG的核心差异在于检索逻辑的优化方式传统RAG直接对用户原始查询进行向量化检索而HyDE先利用大模型生成一个符合问题意图的假设性答案文档如虚构的详细回答模板再将此假设文档转化为嵌入向量进行检索最后结合真实文档生成最终答案。这种间接检索策略能显著提升对模糊查询如开放性问题、抽象需求的适应性通过假设文档的桥梁作用弥合用户简单提问与复杂知识之间的语义鸿沟这种方法可以提供更准确、更符合上下文相关性的结果尤其是在处理复杂或细微的查询时。但这种方法会额外增加生成假设文档的计算步骤。HyDE工作原理HyDE通过生成假设性文档作为检索中介将模糊的用户查询转化为语义丰富的虚拟文档再基于此文档嵌入进行精准检索最终生成答案。其本质是以生成辅助检索的二阶段策略。HyDE基本交互示意HyDE不是使用查询及其生成的向量直接在向量数据库中搜索而是通过采用类似于ChatGPT的语言学习模型来响应查询从而生成虚拟文档。使用HyDE的RAG流程HyDE的工作原理可概括为如下三个关键步骤1. 生成假设文件HyDE会引导大语言模型例如DeepSeek创建一份假设文档来响应用户的查询。虽然该文本的目的是识别相关模式但其中可能存在错误。2. 无监督编码然后使用无监督对比编码器将生成的假设文档编码为嵌入向量。基于向量相似性该向量指定语料库嵌入空间中检索相似真实文档的区域捕捉文档语义的文档密集数字表示。3.检索过程HyDE在整个检索过程中使用语料库来查找与编码的假设文档最具可比性的实际文档。通常会采用混合检索HyDE 不会检索整个文档而是根据查询检索最相关的向量嵌入。此过程结合使用检索和生成技术来缩小并优化模型的响应范围。我们可以将HyDE视为一个智能过滤器用于筛选最佳知识片段。这些嵌入就像地图一样可以帮助模型快速找到最相关的信息即使这些信息深藏在海量数据集中。HyDE的优势HyDE之所以引起广泛关注是因为即使在缺乏相关知识标注的情况下它也能很好地发挥作用。它将相关性建模的负担从传统的检索模型转移到一个功能齐全、足以处理各种活动和查询的大语言模型上。这种策略为我们带来以下优势零样本检索 HyDE不需要大量的标记样本数据集即可实现“开箱即用”的功能。跨语言它适用于多语言搜索应用程序因为它在多种语言中都能很好地运行。灵活性 HyDE的方法使其能够适应各种工作而无需进行大量的微调。复杂查询更精准由于HyDE通过嵌入检索更多相关信息因此它可以更精准地处理更复杂的查询。无论您询问的是新兴技术还是多方面的科学概念HyDE都能提供更细致入微、更相关的答案。规模化效率HyDE 的混合嵌入方法使其具有极高的可扩展性。当处理海量数据例如科学期刊或数百万个网页时HyDE仍然可以提供快速准确的响应而不会因检索数据量太大导致效检索率低下。语境感知得益于文档嵌入HyDE能够理解单词、短语和概念之间的语义关系从而提高答案的语境相关性。通过实施HyDE项目实施人员可以创建更强大、更具有上下文感知能力的信息检索系统从而在问答、内容推荐等应用中取得更佳效果。传统RAG与HyDE的区别传统的RAG系统会嵌入查询,会检索与查询文字匹配的文档但会错过上下文相关的信息,当语料库中某些类型的查询的数据很少时传统RAG检索质量就会下降。HyDE 通过使用假设文档作为中介来解决这些问题从而更有效地捕捉查询的意图。两者的本质区别可简单概括为直接检索问题与检索生成答案的蓝图的差异下图清晰地展示了标准RAG与HyDE在响应用户提问时的处理逻辑与流程的差异。传统RAG VS HyDE下表从具体应用中的不同特性对传统RAG与HyDE进行了对比。HyDE通过假设性文档作为检索桥梁特别适合解决模糊查询问题但牺牲了部分可解释性传统RAG更依赖现有知识库的完整性适合结构化数据场景。特性传统RAGHyDE核心机制直接从数据库中检索文档首先生成假设性文档再检索相似内容适用场景知识库庞大的情况数据稀缺或模糊的场景系统复杂度双模型系统检索器生成器假设生成 嵌入搜索灵活性受限于知识库现有数据可生成中间答案假设可解释性答案更容易溯源至原始文档答案背后的逻辑可能较不透明典型应用聊天机器人、问答系统、推荐系统语义搜索、创意生成、知识发现HyDE应用场景HyDE这种灵活的方法特别适合那些难以用精确关键词表达查询意图的情况精度要求大于反馈时效要求且数据集包含密集且上下文丰富的信息的场景例如缺乏关键词匹配的模糊查询、高语义抽象问题、少样本检索增强使得HyDE成为处理复杂、抽象或者跨学科问题的强大工具。例如在技术支持系统、法律文档检索或学术研究中用户通常有复杂的需求而这些需求无法用简单的关键词轻松表达。但是HyDE会增加额外的计算消耗因为它需要为每个查询生成一个假设文档。应用场景应用场景说明法律与合规审查和分析合同、案例、法律和法规。通过生成假设性文档来辅助检索相关的法律条文或判例帮助律师快速定位所需信息。学术研究查找特定主题的学术论文或研究报告。对于缺乏明确关键词的研究领域HyDE可以通过生成假设性的综述文章来提高检索相关文献的准确性。医疗健康检索医学文献支持临床决策。医生可以输入患者的症状描述系统生成假设性病历摘要并据此查找最相关的医学文献或治疗方案。金融投资分析市场趋势及投资机会。投资者可以提出关于某行业未来发展的模糊问题系统基于此生成假设性报告并从数据库中检索相关信息以供参考。技术创新与研发探索新技术方向或解决方案。研究人员可以根据初步想法生成假设性的技术白皮书利用这些文档向量去发现相关的现有技术和潜在的研究方向。教育培训提供个性化的学习资源推荐。根据学生的学习进度和个人兴趣点生成假设性的学习计划或课程大纲从而推荐最适合的学习材料。市场营销制定市场营销策略。营销人员可以根据产品特点或目标群体的需求生成假设性的市场调研报告以此为基础寻找成功的案例研究或竞争对手分析。知识管理与企业搜索改善企业内部知识发现效率。员工可以通过描述他们想要解决的问题或寻找的信息类型系统自动生成假设性文档并进行匹配帮助找到隐藏在大量数据中的有价值信息。在具体项目实施过程中需要考虑计算效率与结果准确性之间的平衡如果您的系统优先考虑速度例如实时聊天那么传统的RAG嵌入可能就足够了。但如果精度至关重要并且您有资源在检索过程中运行大语言模型那么HyDE可以显著提升召回效果。此外还可以将HyDE与混合搜索技术相结合——例如先使用关键词筛选结果然后再使用HyDE进行细化——以平衡效率和效果。RAGFusionRAGFusion基本概念RAG-Fusion建立在原始RAG模型的基础上该模型将检索与生成式转换器相结合以生成更符合语境、更符合事实的输出。RAG会检索相关文档并将这些信息整合到生成过程中而RAG-Fusion则创新地在检索到的文档通过模型处理之前对其进行了早期融合。这使得模型能够同时集成多个文档从而提升其生成更连贯、语境更丰富且更基于事实的响应的能力。RAG-Fusion工作原理RAG-Fusion使用与RAG相同的技术Python 语言、Elasticsearch或Pinecone等向量搜索数据库以及DeepSeek等大模型。RAG-Fusion的工作方法与RAG相同但是它增加了一些步骤例如查询生成和结果重新排序从而改善了响应质量。传统的检索增强方法通常根据查询选择少量文档并在后期处理阶段整合其信息。而RAG-Fusion采用早期融合机制在早期阶段整合这些文档从而使模型能够处理更大的检索文档集并合成更复杂的知识。RAG-Fusion通过将检索到的文档融合成一个统一的批次该模型可以跨多个数据点保留上下文和细微差别。这种早期融合不仅降低了出现冲突或不连贯响应的风险还增强了模型回答复杂、多方面问题的能力。在RAG-Fusion中不是生成一个查询而是生成多个查询。如下图所示我们生成了三个查询。对于每个查询执行检索操作并根据与查询的相似性对结果进行排序。如我们所见我们对每个检索查询的文档进行了排名。然后我们需要将这些结果合并在一起以得出最终排名。此合并使用互惠秩融合算法完成。RAG-Fusion工作流程RAG-Fusion系统比传统RAG统采用了更先进的检索和生成方法它将原始用户查询分解为从数据库、研究报告和视频等不同来源提取的更具体的子查询。 然后RAG-Fusion使用一种名为“互易秩融合”RRF的技术为子查询分配分数并根据其与用户原始查询的相关性进行排序。重新排序后的信息随后被汇总或称“融合”以创建全面准确的响应。RAG-Fusion工作原理通过大模型将用户的查询转换为相似但不同的查询从而执行查询复制初始化向量搜索原始查询及其生成的相似查询生成多个查询。使用RRF组合并优化所有查询结果。选择所有具有新查询的顶级结果为大模型提供足够的材料以创建考虑所有查询和重新排序的结果列表的输出响应。RAG-Fusion工作步骤分解复杂查询它生成多个子查询来涵盖用户输入的不同方面。更智能的检索为每个子查询 获取k 个相关文档以确保全面覆盖。相关性排名使用一种称为“倒数排名融合”的方法根据文档的整体相关性对其进行评分和重新排序。优化提示选择排名靠前的文档来构建提示以获得更准确、上下文更丰富的响应。RAG-Fusion背后的复杂性 — RRFRRF互惠排序融合是一种将多个搜索结果合并起来以生成单一统一排名的技术。单个查询无法涵盖用户查询的所有方面而且它可能过于狭窄而无法提供全面的结果因此多查询生成必须考虑所有不同元素并提供精心挑选的答案。RRF 的工作原理是合并不同搜索查询的排名从而增加所有相关文档出现在最终结果中的概率。此外它不依赖于搜索引擎分配的绝对分数而是相对排名因此合并不同比例或分数分布的结果变得切实可行。RAG-Fusion的优势与局限性与传统的单文档RAG相比RAG-Fusion具有以下几个优势更全面的答案结合来自多个来源的信息RAG-Fusion可以提供更完整、更细致的答案尤其是对于复杂的问题。减少偏见依赖单一文档可能会引入偏见。RAG-Fusion通过考虑多种视角来解决这个问题。提高准确性获取更广泛的信息可以带来更准确、更符合事实的回应。任何算法都有其局限性RAG-Fusion也不例外它主要有两个潜在的缺点RAG-Fusion模型通过多次查询生成达到查询深度的能力可以提供详细的答案更像是一个过度解释的答案。多查询输入和多样化的文档集会强调语言模型的上下文窗口导致输出不太连贯。RAGFusion应用场景RAG-Fusion主要适用于需要高精度、多维度检索的复杂场景通过融合多种检索策略如关键词搜索、向量检索、HyDE等提升结果覆盖率和准确性。典型场景包括开放域问答如结合事实性检索与语义推理回答复杂问题跨模态搜索同时处理文本、图像等异构数据源企业知识库查询需平衡结构化数据与非结构化文档的检索需求争议性话题分析通过多路检索验证信息一致性减少偏差。其核心优势在于综合不同检索方法的强项尤其适合对召回率和准确率要求均高的任务。应用场景应用场景说明客户支持和技术协助对于工程和 IT 等通常需要详细文档知识的行业RAG-Fusion 有助于简化支持流程。它无需依赖通用的故障排除步骤而是可以检索特定于产品的文档并将其融合从而提供精确的说明。销售和客户管理销售团队受益于 RAG-Fusion 的能力它能够将产品文档与预先训练好的知识相结合生成高度明智的客户咨询答案。这种集成使销售专业人员能够通过提供技术见解和相关用例更有效地推销产品。增强创意写作和技术写作无论是撰写文章、研究论文还是生成详细报告RAG-Fusion 都能通过融合来自不同来源的信息提供更佳的一致性和深度从而生成更连贯、更翔实的叙述。电子商务推荐RAG-Fusion 可通过合并结构化数据库存、非结构化数据客户评论和多媒体产品图像或视频来实现个性化产品推荐。医疗保健支持行业专业人士可以使用 RAG-Fusion 将结构化数据患者记录与非结构化文本研究论文和成像信息X 射线相集成以提供更全面的医疗保健支持。RAG-Fusion发展潜力RAG-Fusion早期文档融合的意义深远它不仅提升了AI处理复杂查询的能力还为我们在知识密集型行业与AI的互动开辟了新的可能性。随着这项技术的不断发展它可能会重新定义检索增强模型在法律、医疗保健和教育等注重准确性和深度的领域的应用。RAG-Fusion通过推进检索和生成的集成代表着我们朝着更智能、更情境感知的AI系统迈出了重要的一步。这项创新使AI成为商业和研究环境中更有效的解决问题和决策工具。RAG-Fusion是检索增强模型演进的重要一步通过早期文档融合提升了性能。随着人工智能的复杂性和能力不断提升像RAG-Fusion这样的模型将在开启知识生成和检索的新可能性方面发挥关键作用。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】