2026/4/18 4:22:30
网站建设
项目流程
漳浦网站制作,橘子建站是什么,济南制作网站,淮安神舟建设招标网站1. 什么是知识库#xff1f;
一句话#xff1a;公司里所有结构化、非结构化的信息#xff0c;都可以放进知识库。
它可以包含#xff1a;
规章制度流程说明合同模板历史审批案例员工手册项目文档邮件、聊天记录#xff08;如果允许#xff09;扫描件、PDF、图片里的文字内…1. 什么是知识库一句话公司里所有结构化、非结构化的信息都可以放进知识库。它可以包含规章制度流程说明合同模板历史审批案例员工手册项目文档邮件、聊天记录如果允许扫描件、PDF、图片里的文字内容经 OCR 处理后在 AI 时代知识库不是给人“翻”的而是给 AI“读”的。2. 什么是向量数据库一句话把文字变成“数学向量”然后用向量数据库来存、来查。为什么要这么做因为计算机看不懂文字但能看懂向量。向量可以表达语义比如“请假流程”“如何申请年假”“年假怎么批”这三句话的向量会非常接近因为意思差不多。向量数据库做的事情就是把文档内容转成向量当你提问时也把问题转成向量用向量相似度快速找到“意思相近”的内容常见的向量数据库Milvus、Pinecone、Weaviate、FAISS 等。3. 什么是召回一句话从海量数据里快速把“可能相关”的内容捞出来。它不是最终答案只是“候选集”。比如你问“年假怎么申请”召回阶段可能会从知识库中捞出年假流程文档请假制度 PDF历史审批案例中含“年假”的记录员工手册中关于休假的章节这些是“可能有用”的内容数量一般是几十到几百条。召回之后才会进入 AI 的“精排”阶段让 AI 从这些候选里挑最有用的来生成回答。4. 一个具体的 OA AI 场景非常典型假设你们公司有一个 OA 系统里面有10000 份历史审批记录500 份制度文档200 份流程说明大量合同模板、会议纪要等现在员工在 OA 的 AI 助手对话框里输入“我想请 3 天年假需要谁审批”下面我带你看整个流程第一步问题进入系统用户输入“我想请 3 天年假需要谁审批”第二步把问题转成向量AI 模型如 Embedding 模型把这句话转成一个向量比如[0.12, -0.34, 0.56, … , 0.09]第三步向量数据库“召回”相关内容系统拿着这个向量去向量数据库里搜索找到最相似的向量对应的文档比如《员工休假管理制度》《年假申请流程说明》历史审批案例员工 A 请 3 天年假由直属经理审批历史审批案例员工 B 请 5 天年假由经理 部门负责人审批《OA 请假操作指南》这些就是“召回”出来的候选内容。第四步AI 精读这些内容生成回答AI 拿到这些候选文档后会阅读并总结最终给用户一个清晰的答案“根据公司制度3 天年假需要直属经理审批。流程是在 OA 中提交请假申请 → 经理审批 → 自动归档。”第五步如果需要还能给出引用来源比如来自《员工休假管理制度》第 3.2 条参考案例员工 A2025-06-12这样用户更信任。5. 这个场景里三个概念的角色总结知识库存放所有制度、流程、案例等原始信息向量数据库把这些信息转成向量并提供快速相似度检索召回根据用户问题从海量文档中快速捞出最相关的一批内容供 AI 精排三者配合让 OA 的 AI 助手能回答复杂问题而不是只会“关键词匹配”。