2026/6/20 12:58:01
网站建设
项目流程
点图片跳到网站怎么做,天猫网上购物商城,目前最新的营销模式有哪些,做任务领取礼品的网站背景知识
一、什么是大模型
为了对人类语言的内在规律进行建模#xff0c;研究者们提出使用语言模型#xff08;language model#xff09;来准确预测词序列中 下一个词 或者 缺失的词 的概率。
如下图所示#xff0c;截止到目前#xff0c;语言模型已经演化了四代研究者们提出使用语言模型language model来准确预测词序列中下一个词或者缺失的词的概率。如下图所示截止到目前语言模型已经演化了四代分别是统计语言模型Statistical Language Model, SLM使用马尔可夫假设Markov Assumption来建模语言序列的 元-gram语言模型神经语言模型Neural Language Model, NLM基于神经网络构建语言模型如循环神经网络Recurrent Neural Networks, RNN并学习上下文相关的词表示即分布式词向量也被称为词嵌入Word Embedding。代表性工作word2vec预训练语言模型Pre-trained Language Model, PLM使用大量的无标注数据预训练双向 LSTMBidirectional LSTM, biLSTM或者Transformer然后在下游任务上进行微调Fine-Tuning。代表性工作ELMo、BERT、GPT-1/2大语言模型Large Language Model, LLM基于“扩展法则”Scaling Law即通过增加模型参数或训练数据可以提升下游任务的性能同时具有小模型不具有的“涌现能力”Emergent Abilities。代表性工作GPT-3、ChatGPT、Claude、Llama二、大模型是怎么构建的通常来说大模型的构建过程可以分为预训练Pretraining、有监督微调Supervised Fine-tuning, SFT、基于人类反馈的强化学习对齐Reinforcement Learning from Human Feedback, RLHF三个阶段。接下来我们依次介绍一下这三个阶段预训练预训练指使用海量的数据进行模型参数的初始学习旨在为模型参数寻找到一个优质的“起点”。这一概念最初在计算机视觉领域萌芽通过在ImageNet一个大型图像数据集上的训练为模型参数奠定了坚实的基础。随后这一理念被自然语言处理NLP领域采纳word2vec开创先河利用未标注文本构建词嵌入模型ELMo、BERT及GPT-1则进一步推动了“预训练-微调”范式的普及。起初预训练技术专注于解决特定类别的下游任务例如文本分类、序列标注、序列到序列生成等传统NLP任务。OpenAI在GPT-2的研究中提出了一种创新思路——通过大规模文本数据预训练打造能够应对广泛任务的通用解决方案并在GPT-3中将这一理念扩展至前所未有的超大规模。在BERT等早期预训练模型中模型架构和训练任务呈现出多样化特征。然而随着GPT系列模型的兴起“解码器架构预测下一个词”的策略证明了其卓越效能成为了当前主流的大模型技术路线。在预训练过程中首要任务是搜集和清洗海量的文本数据确保剔除潜在的有害内容。鉴于模型的知识库几乎完全源自训练数据数据的质量与多样性对模型性能至关重要。因此获取高质、多元的数据集并对其进行严谨的预处理是打造高性能语言模型的关键步骤。当前多数开源模型的预训练均基于数T的token。例如Llama-1、Llama-2、Llama-3的预训练规模分别为1T、2T和15T。除了对数据量的苛刻要求预训练阶段对计算资源的需求也极为庞大。以Llama-1的65B参数模型为例其在2,048块A100 80GB GPU集群上进行了接近三周的训练。此外预训练过程中还涉及诸多细节诸如数据配比、学习率调度、模型行为监测等这些往往缺乏公开的最佳实践指导需要研发团队具备深厚的训练经验与故障排查能力以规避训练过程中的回溯与重复迭代节约计算资源提高训练效率。总体而言预训练不仅是一项技术挑战更是一场对数据质量、算力投入与研发智慧的综合考验。有监督微调经过大规模预训练后模型已经具备较强的模型能力能够编码丰富的世界知识但是由于预训练任务形式所限这些模型更擅长于文本补全并不适合直接解决具体的任务。尽管引入了诸如上下文学习In-Context Learning, ICL等提示学习策略以增强模型的适应性但模型本身在下游任务解决上的能力仍受限。为了克服这一局限预训练后的大型语言模型往往需经历微调过程以提升其在特定任务中的表现。目前来说比较广泛使用的微调技术是“有监督微调”也叫做指令微调Instruction Tuning该方法利用成对的任务输入与预期输出数据训练模型学会以问答的形式解答问题从而解锁其任务解决潜能。经过指令微调后大语言模型能够展现出较强的指令遵循能力可以通过零样本学习的方式解决多种下游任务。然而值得注意的是指令微调并非无中生有地传授新知而是更多地扮演着催化剂的角色激活模型内在的潜在能力而非单纯地灌输信息。相较于预训练所需的海量数据指令微调所需数据量显著减少从几十万到上百万条不等的数据均可有效激发模型的通用任务解决能力甚至有研究表明少量高质量的指令数据数千至数万条亦能实现令人满意的微调效果。这不仅降低了对计算资源的依赖也提升了微调的灵活性与效率。基于人类反馈的强化学习对齐除了提升任务的解决能力外大语言模型与人类期望、需求及价值观的对齐Alignment至关重要这对于大模型的应用具有重要的意义。OpenAI在 2022 年初发布了 InstructGPT 论文详尽阐述了如何实现语言模型与人类对齐。论文提出了基于人类反馈的强化学习对齐Reinforcement Learning from Human Feedback, RLHF通过指令微调后的强化学习提升模型的人类对齐度。RLHF的核心在于构建一个反映人类价值观的奖励模型Reward Model。这一模型的训练依赖于专家对模型多种输出的偏好排序通过偏好数据训练出的奖励模型能够有效评判模型输出的质量。目前还有很多工作试图去除复杂的强化学习算法或其他使用 SFT 方式来达到与 RLHF 相似的效果从而简化模型的对齐过程。例如直接偏好优化Direct Preference Optimization, DPO它通过与有监督微调相似的复杂度实现模型与人类对齐是一种典型的不需要强化学习的对齐算法。相比RLHFDPO不再需要在训练过程中针对大模型进行采样同时超参数的选择更加容易。最后我们以开源大模型Llama-2-Chat为例简要介绍一下其训练过程。整个过程起始于利用公开数据进行预训练获得Llama-2。在此之后通过有监督微调创建了Llama-2-Chat的初始版本。随后使用基于人类反馈的强化学习RLHF方法来迭代地改进模型具体包括拒绝采样Rejection Sampling和近端策略优化Proximal Policy Optimization, PPO。在RLHF阶段人类偏好数据也在并行迭代以保持奖励模型的更新。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】三、开源大模型和闭源大模型根据上面的学习我们不难发现构建大模型不仅需要海量的数据更依赖于强大的计算能力以确保模型能够快速迭代和优化从而达到预期的性能水平。鉴于此全球范围内能够独立承担起如此庞大计算成本的机构屈指可数。这些机构可以分为以下两大阵营一是选择将模型开源的组织他们秉持着促进学术交流和技术创新的理念让全球的研究者和开发者都能受益于这些模型。通过开放模型的代码和数据集他们加速了整个AI社区的发展促进了创新和技术的民主化。这一阵营的代表有Meta AI、浪潮信息等。另一类则是保持模型闭源的公司它们通常将模型作为核心竞争力用于提供专有服务或产品以维持商业优势。闭源模型通常伴随着专有技术和服务企业可以通过API等方式提供给客户使用而不直接公开模型的细节或代码。这种模式有助于保障公司的商业利益同时也为用户提供了稳定和安全的服务。这一阵营的代表有OpenAI、百度等。无论是开源还是闭源这些大模型都在推动人工智能领域向前发展对于推动大语言模型技术的渐进式发展起到了至关重要的作用。接下来我们以浪潮信息为例简要介绍下浪潮信息源大模型开源体系。四、源大模型开源体系截止到目前浪潮信息已经发布了三个大模型源1.0源2.0和源2.0-M32其中源1.0开放了模型API、高质量中文数据集和代码源2.0和源2.0-M32采用全面开源策略全系列模型参数和代码均可免费下载使用。2021年9月源1.0大模型发布它采用76层的Transformer Decoder结构使用5T数据训练拥有2457亿参数量超越OpenAI研发的GPT-3成为全球最大规模的AI巨量模型表现出了出色的中文理解与创作能力。项目链接: https://github.com/Shawn-IEITSystems/Yuan-1.0官方报道: https://mp.weixin.qq.com/s/6CH0I4eOLzj3YDZyIxdeEQ论文链接: https://arxiv.org/abs/2110.047252023年11月源2.0大模型发布它使用10T数据训练包括1026亿、518亿、21亿 三款参数规模在数理逻辑、代码生成等方面表现出色。在算法方面与传统Attention对输入的所有文字一视同仁不同源2.0提出了局部注意力过滤增强机制Localized Filtering-based Attention, LFA它假设自然语言相邻词之间有更强的语义关联因此针对局部依赖进行了建模最后使得模型精度提高3.53%。项目链接: https://github.com/IEIT-Yuan/Yuan2.0官方报道: https://mp.weixin.qq.com/s/rjnsUS83TT7aEN3r2i0IPQ论文链接: https://arxiv.org/abs/2311.157862024年5月源2.0-M32发布它是一个混合专家Mixture of Experts, MoE大模型使用2000B Tokens训练包含400亿参数37亿激活参数源2.0-M32 包含32个专家基于LFAAttention Router的MoE模型结构。源2.0-M32 在数理逻辑、代码生成、知识等方面精度对标Llama3-70B推理算力降至1/19。本次学习我们将以源2.0-2B模型为例带领大家一起体验源大模型欢迎大家来给项目点点 star 哦五、大模型时代挖掘模型能力的开发范式进入大模型时代人工智能领域的边界正以前所未有的速度扩展而如何充分挖掘大模型的内在潜能成为了应用开发者面前的一道关键课题。在这一背景下不同的应用场景催生了多样化的应用开发策略这些策略不仅展现了大模型应用开发的丰富可能性也预示着未来AI技术在各行业落地的广阔前景。有手就行的Prompt工程Prompt工程Prompt Engineering是指通过精心构造提示Prompt直接调教大模型解决实际问题。为了更充分地挖掘大模型的潜能出现了以下两种技术上下文学习In-Context Learning, ICL将任务说明及示例融入提示文本之中利用模型自身的归纳能力无需额外训练即可完成新任务的学习。思维链提示Chain-of-Thought, CoT引入连贯的逻辑推理链条至提示信息内显著增强了模型处理复杂问题时的解析深度与广度。Embedding辅助给LLM外接大脑尽管大模型具有非常出色的能力然而在实际应用场景中仍然会出现大模型无法满足我们需求的情况主要有以下几方面原因知识局限性大模型的知识来源于训练数据而这些数据主要来自于互联网上已经公开的资源对于一些实时性的或者非公开的由于大模型没有获取到相关数据这部分知识也就无法被掌握。数据安全性为了使得大模型能够具备相应的知识就需要将数据纳入到训练集进行训练。然而对于企业来说数据的安全性至关重要任何形式的数据泄露都可能对企业构成致命的威胁。大模型幻觉由于大模型是基于概率统计进行构建的其输出本质上是一系列数值运算。因此有时会出现模型“一本正经地胡说八道”的情况尤其是在大模型不具备的知识或不擅长的场景中。因此将知识提前转成Embedding向量存入知识库然后通过检索将知识作为背景信息这样就相当于给LLM外接大脑使大模型能够运用这些外部知识生成准确且符合上下文的答案同时能够减少模型幻觉的出现。参数高效微调在实际应用场景中大模型还会经常出现以下问题大模型在当前任务上能力不佳如果提升其能力另外怎么使大模型学习其本身不具备的能力呢这些问题的答案是模型微调。模型微调也被称为指令微调Instruction Tuning或者有监督微调Supervised Fine-tuning, SFT首先需要构建指令训练数据然后通过有监督的方式对大模型的参数进行微调。经过模型微调后大模型能够更好地遵循和执行人类指令进而完成下游任务。然而由于大模型的参数量巨大 进行全量参数微调需要消耗非常多的算力。为了解决这一问题研究者提出了参数高效微调Parameter-efficient Fine-tuning也称为轻量化微调 Lightweight Fine-tuning这些方法通过训练极少的模型参数同时保证微调后的模型表现可以与全量微调相媲美。六、大模型应用开发 必知必会通常一个完整的大模型应用包含一个客户端和一个服务端。客户端接收到用户请求后将请求输入到服务端服务端经过计算得到输出后返回给客户端回复用户的请求。客户端在大模型应用中客户端需要接受用户请求并且能将回复返回给用户。 目前客户端通常使用 [Gradio](https://www.gradio.app/ Gradio) 和 [Streamlit](https://streamlit.io/ Streamlit) 进行开发。 **[Gradio](https://www.gradio.app/ Gradio)** **基本概念**Gradio 有输入输出组件、控制组件、布局组件几个基础模块其中输入输出组件用于展示内容和获取内容如Textbox文本、Image图像布局组件用于更好地规划组件的布局如Column把组件放成一列、Row把组件放成一行推荐使用gradio.Blocks()做更多丰富交互的界面gradio.Interface()只支持单个函数交互控制组件用于直接调用函数无法作为输入输出使用如Button按钮、ClearButton清除按钮Gradio的设计哲学是将输入和输出组件与布局组件分开。输入组件如Textbox、Slider等用于接收用户输入输出组件如Label、Image等用于显示函数的输出结果。而布局组件如Tabs、Columns、Row等则用于组织和排列这些输入和输出组件以创建结构化的用户界面。如果想了解更多组件详情可查看 [官方文档](https://www.gradio.app/guides/quickstart 官方文档) 另外如果想设计更复杂的界面风格还可以查看学习 [官方文档主题](https://www.gradio.app/guides/theming-guide 官方文档主题)Streamlit基础概念Streamlit 中没有gradio的输入和输出概念也没有布局组件的概念。Streamlit每个组件都是独立的需要用什么直接查看官方文档即可大致有如下几种组件页面元素文本数据表格图标绘制柱状图散点图等等输入文本框按钮下拉框滑块复选框文件上传等等多媒体图片音频视频布局和容器Chat聊天对话控件状态进度条加载中等等元素第三方组件提供了更加丰富的组件应用逻辑导航和页面可以切换页面执行流程缓存和状态连接和加密可连接数据库也可以对内容进行加密处理自定义组件公共组件用户信息存储帮助以及输出htmlConfig使用配置文件来定义一些内容工具应用测试命令行服务端在大模型应用中服务端需要与大模型进行交互大模型接受到用户请求后经过复杂的计算得到模型输出。目前服务端主要有以下两种方式直接调用大模型API将请求直接发送给相应的服务商如openai讯飞星火等等待API返回大模型回复✔️ 优点便捷性 不需要关心模型的维护和更新服务商通常会负责这些工作。资源效率 避免了本地硬件投资和维护成本按需付费灵活调整成本支出。稳定性与安全性 专业团队管理可能提供更好的系统稳定性和数据安全性措施。扩展性 API服务易于集成到现有的应用和服务中支持高并发请求。✖️ 缺点网络延迟 需要稳定的网络连接可能会受到网络延迟的影响。数据隐私 数据需要传输到服务商的服务器可能涉及数据安全和隐私问题。成本控制 高频次或大量数据的调用可能会导致较高的费用。依赖性 受制于服务商的政策变化如价格调整、服务条款变更等。大模型本地部署**在本地GPU或者CPU上下载模型文件并基于推理框架进行部署大模型**✔️ 优点数据主权 数据完全在本地处理对于敏感数据处理更为安全。性能可控 可以根据需求优化配置减少网络延迟提高响应速度。成本固定 初始投入后长期运行成本相对固定避免了按使用量付费的不确定性。定制化 更容易针对特定需求进行模型微调或扩展。✖️ 缺点硬件投资 需要强大的计算资源如高性能GPU初期投资成本较高。运维复杂 需要自行管理模型的更新、维护和故障排查。技术门槛 对于非专业团队而言模型的部署和优化可能较为复杂。资源利用率 在低负载情况下本地硬件资源可能无法充分利用。综上选择哪种方式取决于具体的应用场景、数据敏感性、预算以及对延迟和性能的需求。如何学习AI大模型如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】这是一份大模型从零基础到进阶的学习路线大纲全览小伙伴们记得点个收藏第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。100套AI大模型商业化落地方案大模型全套视频教程200本大模型PDF书籍学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。LLM面试题合集大模型产品经理资源合集大模型项目实战合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】