2026/4/18 13:01:52
网站建设
项目流程
校园在线网站怎么做,本地服务推广平台哪个好,家庭组网方案,wordpress淘客主题本文揭秘大模型两大核心参数messages与tools#xff0c;详解RAG检索增强生成与ReAct(ReasonAct)两大范式#xff0c;并介绍调优提示词、增加调用次数和模型微调三种应用手段。文章通过实例展示如何提升大模型应用效果#xff0c;强调大模型虽神秘但使用门槛低#xff0c;适…本文揭秘大模型两大核心参数messages与tools详解RAG检索增强生成与ReAct(ReasonAct)两大范式并介绍调优提示词、增加调用次数和模型微调三种应用手段。文章通过实例展示如何提升大模型应用效果强调大模型虽神秘但使用门槛低适合小白和程序员学习掌握。前言大模型作为新兴领域不断地冒出来新的专有术语和新的概念让大家觉得很神秘捉摸不透。但是大部分复杂性的背后都会有一个极其简单便于理解的模型本次分享最主要就是大模型的基本范式通过范式将这些神秘感去除。大模型虽然很厉害很神秘但作为使用人员门槛是非常非常非常低的。模型基础虽然市面上的大型语言模型LLMs种类繁多但在使用层面大家平等的都是API调包侠因此从接口层面来剖析大模型有哪些能力。LLM的接口通常都遵循或类似于 OpenAI 的规范。这里我们以 OpenAI 的接口为例进行说明。在与大型模型交互时除了控制模型输出随机性的参数外最核心的参数只有两个messages和tools。可以说市面上各种各样的大模型应用都是基于这两个参数的基础上设计而来。messages-大模型是怎么实现记忆的messages是一个对话数组其中角色主要有system代表当前对话的系统指令一般放提示词user用户指令assistantLLM的回复…不同厂商会有不同的扩展定义大模型所谓的对话记忆实际上就是依赖该数组做信息传递如下图所示第一轮我告诉我的名字叫屈定第二轮的时候在问他是谁他已经知道了我的名字之所以知道因为我在messages的上下文中传递给了他这个信息。使用user传递用户的对话使用system设置系统指令提示词的不稳定容易被指令注入攻击三张图看完先总结下大模型为什么能记住之前的对话只是因为后台系统给了他之前的对话并不是他自己记住。大模型的请求调用就是一个无状态的取决于每次给的对话内容。大模型的提示词有什么用大模型的提示词可以进一步控制(覆盖)模型的行为具备高优先级但存在不稳定性。接下来我们就可以来理解第一个重要的大模型范式检索增强生成也就是RAG(Retrieval Augmented Generation)。直白的理解为用检索到的知识来增量生成答案的质量。比如我有一个关于数仓各种问题处理的QA想要做一个问答机器人这个问答机器人要基于我的QA回复用户。这个 检索QA - 基于检索到的QA回复用户这个流程就是一个典型的RAG链路。也显而易见RAG的最终目标是生成靠谱的答案给到用户。RAG链路的搭建是很简单但是效果却很难从流程里面我们能发现两个关键点1.知识库检索召回这里要解决如何召回最靠谱的答案。2.LLM基于知识回答这里要解决的是如何让模型在一堆知识中给出自信准确的回答。这些都是业界在不断探索的东西没有所谓的标准答案只有适合当前业务的最佳方案。tools-大模型能执行任何工具经常有同学会问一些大模型是否能查询odps或者大模型能够把数仓数据导入到ob之类的问题。这些问题的背后是对LLM存在错误的理解也就是tools参数的理解。tools也是一个数组包含了一堆工具集合核心为工具的作用描述和工具需要的参数如下图天气工具的定义。接下来就是使用工具基于工具的回答至少要两次大模型请求调用1.将用户的对话和工具一起给到大模型大模型需要执行的工具以及工具参数2.后端系统依据大模型选择结果去执行对应的工具拿到结果3.再次请求大模型此时上下文中给到了工具执行结果大模型基于信息回复先总结下1.大模型并不能够执行任何工具但是大模型能够选择接下来要执行的工具。选择后工具由配合的系统来执行获取结果。接下来我们就可以来理解第二个重要的大模型范式ReAct(ReasonAct)。这里需要强调下大模型的很多范式都是对生活中人类行为的模拟因此我们也是从生活中的案例来理解大模型。案例主题老板让写一份调研外部大模型框架的报告工具互联网搜索PPT思维导图思考 (Reasoning): 需要调研外部大模型框架明确调研目标是了解行业内的主要框架、特点和应用场景。需要先明确有哪些主流框架然后针对性地收集资料。思考 (Reasoning): 我已经拿到了想要的资料接下来使用思维导图搭建汇报思路思考 (Reasoning): 信息基本收集完毕需要将所有信息整理成结构化的报告并使用PPT进行总结和分析。这个思考的流程就是ReAct后面有实际案例这里先理解这个概念。模型使用大模型的应用五花八门但都离不开上述两个核心参数接下来围绕上述的参数我们能利用的现有的模型交互手段主要有以下三种包括调优提示词大模型工程中的核心提示词的优秀与否决定了你是否需要链路上做额外的兜底增加调用次数将一个任务拆分为多个子任务执行最后判断结果。这是一种常用的对提示词能力的补充手段降低单一提示词的复杂性。模型微调通过引入特定业务场景案例让模型能更好地理解用户的意图和需求。用大模型提示词做翻译 [提示词调优]为了更好的评价我们选择哪吒中的英文台词然后将英文翻译成中文看还原度如何The prejudice in peoples hearts is like a mountain. No matter how hard you try, you cant move it.方案一直接使用提示词进行翻译## Role and Goal:绝大多数情况下直接使用提示词能做到的效果就已经能达到60%了现在的模型确实强大了下方的问题在于一些短的语句翻译不够传神。模型方案一翻译结果gemini-2.0-flash* 人心中的成见就像一座大山任你怎么努力也无法搬动。 * 如今想来三年光阴也不算长。 * 还不快快听我号令 * 我命由我定不由天 * 要问我人能否改变自己的命运我不知道。但是逆天而行就是哪吒的命。方案二提示词中引入COTChain-of-ThoughtCOT被称为思维链简单点来说是要告诉模型针对问题的思考步骤是什么引导模型去按照特定思维解决问题。概念很抽象以翻译为例我们思考一般人是如何进行翻译的1.先直接翻译2.结合上下文再审视这个翻译是否合理有哪些改进点3.针对改进点再斟酌修改那么我们也让模型按照这个思路来执行翻译。## Role and Goal:该方案取得了意想不到的效果针对长句翻译成短句组合形式 相比官方的来看更像是修道者的口吻但针对一些特殊短句用法仍然不够理想。模型方案一翻译结果方案二翻译结果gemini2.0 flash* 人心中的成见就像一座大山任你怎么努力也无法搬动。 * 如今想来三年光阴也不算长。 * 还不快快听我号令 * 我命由我定不由天 * 要问我人能否改变自己的命运我不知道。但是逆天而行就是哪吒的命。* 人心存偏见如山岳难移。纵使竭尽全力亦不可撼动分毫。 * 如今想来三年光阴弹指一挥间。 * 奉我号令不得有误 * 我命由我不由天 * 若问世人能否逆天改命吾不得而知。然抗争宿命乃哪吒之命也。方案三引入动态few shotfew shot指的是提示词中的少样本技巧动态就是将这部分样本抽离到一个知识库每一次走翻译前先去知识库里面召回TOP最相关的然后放入到提示词的Example中。假设我的知识库中召回了如下两句Item1: 原文Be quick to obey my command结合后提示词如下## Role and Goal:模型方案一翻译结果方案二翻译结果方案三翻译结果gemini2.0 flash* 人心中的成见就像一座大山任你怎么努力也无法搬动。 * 如今想来三年光阴也不算长。 * 还不快快听我号令 * 我命由我定不由天 * 要问我人能否改变自己的命运我不知道。但是逆天而行就是哪吒的命。* 人心存偏见如山岳难移。纵使竭尽全力亦不可撼动分毫。 * 如今想来三年光阴弹指一挥间。 * 奉我号令不得有误 * 我命由我不由天 * 若问世人能否逆天改命吾不得而知。然抗争宿命乃哪吒之命也。* 人心之偏见如山岳岿然纵移山填海亦难撼其分毫。 * 事过境迁三年光阴亦不过弹指一挥间。 * 急急如律令 * 我命由我不由天 * 若问人定胜天否我亦茫然。然逆天而行乃哪吒之宿命。few shot这种开卷考试方法是大模型链路中一种重要的优化手段few shot是提示词中为数不多能够动态变化的部分且对模型整体效果影响较小更为可控。此外业务流量一般都是符合2:8分布的且是可收敛的可能只需要20%的few shot案例就能满足80%的场景诉求。用大模型Agent做计算器 [增加调用次数]大家应该都看过下面的案例大模型是很不擅长数学计算的那么用大模型直接做计算器就非常容易出问题。这里使用llama_index的agent框架做演示1.定义了三个工具函数乘法加法减法2.构建一个Agent执行模式import os Running step cba1a160-74c3-4e34-bcc4-88e6a678eaf9. Step input: What is 60-(20(2*4))? Calculate step by step上次有同学问那么大模型在这种链路里面到底发挥了什么作用大模型最大的能力就是自然语言理解我们可以尝试把规则再复杂化输入改成张三代表减法,李四代表加法,王二代表乘法,What is 60张三(20李四(2王二4))? Calculate step by step表现仍然可以这就带来了对自然语言的容错会像人一样去思考而不是固定死的逻辑。Thought: The current language of the user is English. I need to use a tool to help me answer the question. The expression given is 60张三(20李四(2王二4)), which translates to 60 - (20 (2 * 4)). I will calculate step by step.模型微调这部分具体案例就不好说了我举个实际生产的案例在给WorldFirst做客服的时候存在很多特殊的业务知识比如用户在万里汇下载银行对账单 ! 下载交易流水单。这里有业务背景银行对账单是亚马逊要求的账户证明文件。这些业务背景是模型难以掌握的此时就需要引入微调将这部分知识内置到模型里面。现在主流的方式都在慢慢弱化微调因为费时费力还不一定起到正向的效果更多的工程实践是将提示词复杂化动态化工程上做更多的兜底工作。一些感想大模型能带来很大的工作和问题思考方式的革新让一些问题解决方式变成取决于你的想象力但对客的业务的效果并非完全取决于大模型。很多同学认为有了LLM业务效果开发效率交付质量都能很方便解决什么都往LLM上靠拢这是很大的误区。最后我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包✅AI大模型学习路线图✅Agent行业报告✅100集大模型视频教程✅大模型书籍PDF✅DeepSeek教程✅AI产品经理入门资料完整的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】为什么说现在普通人就业/升职加薪的首选是AI大模型人工智能技术的爆发式增长正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议到全国两会关于AI产业发展的政策聚焦再到招聘会上排起的长队AI的热度已从技术领域渗透到就业市场的每一个角落。智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200%远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。资料包有什么①从入门到精通的全套视频教程⑤⑥包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图还有视频解说全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤ 这些资料真的有用吗?这份资料由我和鲁为民博士共同整理鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。所有的视频教程由智泊AI老师录制且资料与智泊AI共享相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念通过动态追踪大模型开发、数据标注伦理等前沿技术趋势构建起前沿课程智能实训精准就业的高效培养体系。课堂上不光教理论还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】**