2026/4/18 7:27:49
网站建设
项目流程
网站开发公司资质,北京营销型网站公司,网站空间在哪买,普陀做网站未来#xff0c;每个产品经理都是 AI 产品经理#xff0c;而每个 AI 产品经理都必须懂 RAG。
所谓RAG#xff08;Retrieval - Augmented Generation#xff09;#xff0c;即信息检索#xff08;Retrieval#xff09;内容生成#xff08;Generation#xff09;。图片来…未来每个产品经理都是 AI 产品经理而每个 AI 产品经理都必须懂 RAG。所谓RAGRetrieval - Augmented Generation即信息检索Retrieval内容生成Generation。图片来源百度通过 RAG可以让大模型从指定的内部知识库“检索”准确的内容再根据准确的内容“生成”回答内容从而有效避免幻觉。比如如果直接让大模型进行医疗诊断由于大模型的本质是概率模型因此它会提供大量错误或者不相关的信息。有了RAG大模型就可以从海量的医学文献、病例库中直接检索与患者病症相关的知识再生成诊断建议供医生参考从而提高内容的准确性。接下来给大家介绍 RAG 的 7 个核心概念看完以后你会对 RAG 有更深入的认识。1、向量数据库向量数据库是 RAG 最重要的基础设施之一。传统数据库的内容查询主要依赖“关键词匹配”对查询的精确度要求很高。比如如果你查询“如何提高工作效率”而数据库只有“时间管理技巧”内容那么就无法搜索出任何内容。而向量数据库就可以有效解决这个问题它会把各种知识都转换成一组组数字向量这些数字能代表知识的内容和特点当你在 RAG 系统中输入查找信息时它会把输入信息也转换成一组数字向量然后在数据库中找出最相关的知识从而实现“语义检索”。图片来源百度比如下面的每个知识都转化为了一个 3 维向量实际应用中可能把一个知识转化为几十甚至几千维的向量时间管理[0.120.230.46]工作地点[0.920.820.65]考勤制度[0.830.930.78]当用户查询“工作效率”向量数据库就可以把“工作效率”转化为向量 [0.120.230.53]。显然它和“时间管理”的向量 [0.120.230.46] 相似度很高——从业务上来说是因为“时间管理”是提高“工作效率”的一种有效方法这就导致两者的语义高度相关。其实这就是“语义检索”的过程。在传统客服系统中由于依赖“关键词匹配”在面对复杂咨询时就很难给出用户想要的答案。而 AI 客服使用向量数据库当用户咨询时可以通过 “语义检索”快速找到最相关的答案从而提升用户体验和满意度。2、混合检索图片来源CSDN智兔唯新基于向量知识库的语义检索虽然很好但是也存在 2 个问题首先是面对超大数据量语义检索的速度不如传统的关键词检索。其次是对于一些需要精确匹配的场景关键词匹配更有优势。比如在法律文件检索中法律条文、案例等对措辞的精准要求就很高。因此在很多场景下RAG 会同时使用关键词检索和语义检索从而尽可能的提升检索体验。比如在电商平台上用户搜索“无线蓝牙耳机”。纯语义检索可能会推荐一些带有“无线”或“蓝牙”字样的普通耳机但混合检索除了语义匹配还会根据关键词“无线蓝牙”进行精确匹配确保优先推荐符合“无线蓝牙耳机”这一完整要求的产品。3、分块、嵌入与索引RAG在存储知识时为了更高效地管理和检索通常会将原始文档按照一定的规则如固定长度、语义单元等分块。就如同一本很长的小说如果把它切成一个个章节或者更小的段落块那么在查找某个故事情节时就更方便快捷。分块以后还需要把每一个块转化为向量从而存储到向量数据库这就是嵌入。嵌入以后还可以把向量存储到一个高效的检索结构中以便快速进行相似性计算和检索这就是索引。比如某法律咨询平台为用户提供在线法律咨询服务。由于法律领域的知识库通常非常庞大且复杂包含大量的文本信息如法律条文、司法解释、案例判决书等。在构建知识库时就可以将法律条文、案例等长文本分割成多个小块同时利用索引结构记录每个小块的向量位置以便快速检索。这样当用户输入法律问题如“合同违约的赔偿标准是什么”RAG 就可以从数据库中快速找到最相关的多个小块并通过上下文融合来生成更为准确和完整的答案。4、重排序re-rank图片来源公众号AI大模型应用实践当 RAG 从数据库中检索出多个内容时需要选取相关性最大的内容喂给大模型从而提高大模型的回答质量。所谓重排序是指 RAG 将初步检索出来的内容进行重新排序其目的是将最相关的信息排在前面从而选取出相对更为准确的内容。打个比方你想让 AI 搜索一批书籍RAG 会先大致找出一批可能你想要的书籍然后仔细评估每一本书和你需求的契合程度把最符合你心意的书排在最前面方便你优先查看。重排序的应用非常广泛比如电商平台根据用户需求初步筛选出一批商品后就会通过“重排序”根据用户的实时行为、偏好历史等对推荐商品进行重新排序把更符合用户当下需求的商品排在前面提高推荐的准确性和实用性。5、上下文融合上下文融合是指 RAG 将从多个来源检索到的知识进行整合以便为大模型提供更全面、连贯的输入内容这样大模型的回答才能条理清晰、内容完整。比如在智能客服场景中用户咨询“我刚收到的商品有点瑕疵我可以申请退货吗”要回答好这个问题RAG 就需要从多个来源检索信息比如用户的订单信息、退货政策等再把这些内容整理成统一的内容以便大模型能够基于内容生成高质量的回答。6、准确率和召回率准确率Precision是指在 RAG 检索到的内容中与用户问题真正相关的内容的比例。例如在一个问答系统中检索到 10 条知识其中有 8 条与用户问题高度相关那么准确率就是 80%。准确率是衡量检索质量最重要的指标之一。比如智能客服在回答用户问题时如果准确率不高就会提供大量不相关或错误的答案影响用户体验。但是只有高的准确率还不够还必须有高的召回率。所谓召回率Recall是指与用户问题相关的所有知识中被成功检索到的比例。例如知识库中有 20 条与用户问题相关的知识检索到 12 条那么召回率就是 60%。在实际应用场景中召回率和准确率往往会成为跷跷板。比如如果过度追求高召回率可能会导致检索结果中包含大量不相关的信息影响准确率。反之亦然。比如在一个电商商品检索系统中为了尽可能多地召回相关商品降低了检索阈值结果导致很多边缘相关甚至不相关的商品也出现在结果中。在这种情况下我们可以引入 F1 值进行综合评估从而找到召回率和准确率之间的平衡点。F1 值的计算公式是F1 2*(准确率*召回率)/(准确率召回率)。在这个公式中当准确率或者召回率中的任何一个非常低时F1 值也会相应的降低。7、知识图谱图片来源CSDN思通数科x知识图谱就像是一个巨大的知识网络把各种知识当作一个个节点并且把有关系的节点进行连接。比如通过知识图谱可以对菜谱知识进行管理把各个菜谱、原材料、烹饪方法连接起来这样当用户询问“用鸡蛋可以做哪些菜”时RAG 就可以通过“菜谱-原材料”的连接关系准确找到使用“鸡蛋”的菜谱。通过知识图谱RAG 能够捕捉到实体间的复杂关系还能够基于已有的实体关系进行推理和扩展发现更多潜在的相关信息从而大大提升准确率和召回率。比如一年级有 5 个班RAG 数据库中记录了 5 个班各自的期末成绩但是并没有存储“一年级所有同学的平均成绩”。这就导致当用户询问“一年级期末平均成绩是多少”时RAG 找不到相关内容最后给出一个错误的答案。但是如果我们通过知识图谱建立了“一年级”和“5 个班级”之间的实体关系RAG 就能根据根据这个关系找到“5 个班级的期末成绩”再通过计算给到用户一个准确的回答。最后一个 RAG 系统的运行可能包含以下步骤1、向量数据库提供知识存储的基础设施2、对内容进行分块、嵌入和索引以方便检索3、再通过知识图谱建立相关实体的关系从而提高检索和生成的准确度4、当用户查询时通过混合检索、知识图谱等方式检索内容5、然后把检索出来的内容进行重排序选出最相关的内容6、把选出的内容进行上下文融合提供给大模型生成回答内容7、最后通过 F1 值对 RAG 系统的准确率和召回率进行综合评估以上内容你学废了吗、普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发