2026/4/18 4:29:09
网站建设
项目流程
有没有专业做咖啡店设计的网站,最好的做法,如何做微信网站建设,公众号的文章下载 wordpress文章全面介绍阿里系开源大模型项目#xff0c;包括达摩院的具身智能三大件、视频多模态模型#xff0c;通义实验室的Qwen2.5/Qwen3系列#xff0c;以及蚂蚁集团的AI原生数据、扩散语言模型与多智能体项目。提供选型指南#xff0c;帮助开发者构建基于Qwen大模型的AI应用系统…文章全面介绍阿里系开源大模型项目包括达摩院的具身智能三大件、视频多模态模型通义实验室的Qwen2.5/Qwen3系列以及蚂蚁集团的AI原生数据、扩散语言模型与多智能体项目。提供选型指南帮助开发者构建基于Qwen大模型的AI应用系统。(说明本文仅收录了阿里系部分开源项目且部分信息可能存在更新不及时的问题) 为什么阿里系开源火力拉满过去一年里阿里系在开源上的“火力”明显拉满✅ 一方面Qwen2.5 / Qwen3 系列大模型持续迭代基本构成阿里系所有 AI 开源工程的“地基”✅ 另一方面从具身智能三大件、视频多模态大模型到数据库场景的 AI 框架、多智能体Multi-Agent平台、扩散语言模型阿里系仍在不同垂直方向不断放出新项目 一、达摩院具身智能 多模态 AI 的“前沿实验场” 1. Rynn 系列具身智能「三大件」2025 年 8 月阿里达摩院在世界机器人大会上开源具身智能三大核心组件1RynnRCP机器人上下文协议GitHub: alibaba-damo-academy/RynnRCP约 117★定位一套完整的机器人服务协议与框架核心由两部分构成RCP framework抽象机器人本体与传感器能力提供统一接口并适配不同传输层与模型服务RobotMotion在“云端推理”与“机器人本体控制”之间搭桥将离散、低频的推理指令转换为高频连续控制信号同时提供 MuJoCo 仿真、真机调试与回放、轨迹可视化等工具代表价值将 MCPModel Context Protocol理念引入具身智能提出面向机器人的 RCPRobotics Context Protocol打通“传感器数据采集 → 模型推理 → 动作执行”闭环流程解决开发碎片化、适配难问题活跃度2025 年 8 月刚开源配套论文与多篇深度解读持续出现高度活跃2RynnVLA-001基于人类示范的 VLA 模型GitHub: alibaba-damo-academy/RynnVLA-001约 275★定位视觉-语言-动作Vision-Language-Action, VLA模型核心思想先在 1200 万条第一人称操作视频上做视频生成 轨迹感知预训练再迁移到机器人操作任务技术特点三阶段训练自我视角图像→视频生成预训练 → 关键点轨迹预测增强“动作意识” → 转化为 VLA 模型ActionVAE 将动作序列压缩到低维潜空间降低输出复杂度效果在多项抓取与放置任务中优于同类基线在真实机械臂实验中表现稳定活跃度2025 年 8 月发布后持续更新处于快速扩散期3RynnVLA-002统一 VLA 与世界模型的「动作世界模型」GitHub: alibaba-damo-academy/RynnVLA-002约 829★定位自回归 Action World Model统一“视觉-语言-动作VLA”与“世界模型”关键创新图像、文本、动作共享统一词表在单一 LLM 架构中统一理解 生成多模态世界模型用“动作视觉输入”预测未来图像状态学习环境物理规律反向增强动作规划实现 VLA 与世界模型的“双向增强”世界模型提升动作规划符合物理VLA 提升场景建模性能亮点LIBERO 仿真基准零预训练 97.4% 成功率真实 LeRobot 任务成功率提升 50%活跃度2025 年 11 月公开论文和代码Star 持续上涨2025 年具身智能最热项目4RynnEC让 MLLM 真正“看懂”三维世界GitHub: alibaba-damo-academy/RynnEC约 384★定位为具身认知任务设计的视频多模态大语言模型MLLM专注“世界理解”能力与特点从位置、功能、数量等 11 个维度解析场景中的物体进行空间关系推理如判断移动物体是否会碰撞构建基于普通视频的数据生成流水线大幅降低 3D 标注成本应用场景辅助机器人完成空间理解、导航、物体操作等具身任务活跃度2025 年 8 月发布论文、模型与基准持续更新高度活跃 2. VideoLLaMA37B 参数的视频理解 SOTAGitHub: DAMO-NLP-SG/VideoLLaMA3约 1.1k★发布时间2025 年 2 月定位面向图像和视频理解的多模态基础模型7B 参数主力版 2B 端侧轻量版技术亮点以视觉为中心设计先用高质量图像-文本数据打基础再用少量视频-文本数据微调任意分辨率视觉 Token 化AVT打破固定分辨率限制差分帧剪枝器DiffFP压缩冗余帧降低算力消耗效果通用视频理解、时间推理、长视频理解刷新同规模开源模型 SOTA文档/图表理解、数学推理MathVista、InfoVQA 等图像基准表现突出活跃度2025 年 2 月开源后持续有 Issue/PR 与衍生模型更新高度活跃 3. WebAgent DeepResearch端到端 Web 智能体与“深度研究”助手1WebAgent自主搜索智能体体系时间2025 年 5 月开源核心模块WebDancer端到端训练框架实现多步信息检索WebWalkerWeb 遍历与导航的 BenchmarkWebSailor、WebShaper、WebWatcher围绕数据合成、视觉-语言深度研究等场景Star 活跃度整体框架 Star 突破万级DeepResearch 仓库约 17.9k★入选“Top Agentic Project”榜单极度活跃2DeepResearch长程“深度研究”智能体GitHub: Alibaba-NLP/DeepResearch约 17.9k★定位通义实验室推出的“深度研究” Agent支持多轮检索、多跳推理、长文档分析模型规模30.5B 总参数每 token 仅激活 3.3B特点基于 WebAgent 系列构建完整深度研究流水线GitHub Trending 长期霸榜Star 破万活跃度2025 年 9 月 Star 突破 17k多语言实现持续更新高度活跃 4. OpenAvatarChat单机可跑的实时数字人对话系统GitHub: HumanAIGC-Engineering/OpenAvatarChat约 3k★发布时间2025 年 4 月背景由阿里巴巴达摩院孵化能力单台 PC 运行完整链路ASR → LLM → TTS → 数字人表情驱动延迟约 2.2 秒支持 2D/3D 头像、摄像头视觉分析、实时表情驱动模块化设计ASR/LLM/TTS/Avatar 可替换如接入 MiniCPM-o、CosyVoice应用场景虚拟主播、在线客服、教育陪练、AI 助手活跃度2025 年多篇部署教程、B 站官方教程、频繁 Release高度活跃 5. FunClip语音驱动的本地化 AI 视频剪辑工具GitHub: modelscope/FunClip约 5.3k★定位完全开源、本地部署的自动化视频剪辑工具功能亮点工业级中文 ASRParaformer-Large支持热词定制、说话人分离按文本片段/说话人批量剪辑自动导出全视频/目标片段 SRT 字幕集成多种 LLMqwen 系列、gpt 系列实现“语义级”剪辑活跃度2024 发布2025 持续功能迭代与生态扩展高度活跃 二、通义实验室Qwen2.5 Qwen3阿里开源版图的“地基”通义实验室的 Qwen2.5 / Qwen3 系列是阿里系开源的“地基”从通用大模型到代码、多模态、长文本、Embedding、Agent 框架几乎所有高星项目都围绕 Qwen 展开 1. Qwen2.5从通用大模型到 Omni 多模态发布时间段2024 年 9 月起2.5 主线2025 年 1-3 月集中放量代表仓库与 StarQwen2.5-Omni约 3.9k★端到端多模态处理文本/图像/音频/视频输入Qwen2.5-Coder约 14.8k★0.5B32B 全尺寸代码模型Qwen2.5-VL约 6.5k★3B / 7B / 72B 视觉-语言模型Qwen2.5-Math约 1.1k★数学专用模型Qwen2.5-1M 系列支持 100 万 token 上下文长文档处理领先Qwen-Wan2.x系列开放和高级的大规模视频生成模型定位与价值统一架构覆盖语言/视觉/音频/视频/数学/代码/长文本七大方向Qwen2.5-1M 将上下文长度拉到 1M tokens使超长文档处理成为现实Omni 模型实现“实时语音视频对话”开箱即用能力 2. Qwen3混合推理时代的“王炸开源”发布时间2025 年 4 月 29 日核心仓库与 StarQwen3发布首日近 20k★入选“2025 年最热开源项目”Qwen3-Coder约 14.8k★Qwen3-VL约 17.7k★Qwen3-Omni约 3.2k★技术与使用特点“混合推理Hybrid Reasoning”架构普通生成模式 思考模式类似 DeepSeek-R1 的思维链全尺寸 MoE Dense 开源Qwen3-235B-A22B激活 22B对标 DeepSeek-R1生态一体化打包 Coder、VL、Omni、Embedding、RAG、Agent 框架等完整链条 3. Agent 与工具链Qwen-Agent / Qwen-Code / Embedding 家族1Qwen-Agent大模型应用开发框架GitHub: QwenLM/Qwen-Agent约 10k–11k★能力封装指令跟随、Function Calling、MCP、Code Interpreter、RAG、浏览器控制提供 GUI Demo、Chrome 插件、工具调用示例活跃度2024 年 9 月至今多次迭代GitHub Trending 常驻高度活跃2Qwen-Code终端里的 AI 编程 AgentGitHub: QwenLM/qwen-code快速突破 10k★定位开源、跨平台终端 AI 助手针对 Qwen3-Coder 深度优化能力理解重构大规模代码仓库命令行中直接调用编辑器、运行测试、生成补丁集成 VS Code、MCP 等生态价值让“用开源大模型做日常开发”从概念落地实践3Qwen3-Embedding / Qwen3-VL-EmbeddingQwen3-Embedding约 1.7k★文本嵌入MTEB 多语言榜单领先Qwen3-VL-Embedding约 300★文本-图像-视频统一检索应用被 RAGFlow、Milvus 等集成用于企业级知识库构建 三、蚂蚁集团AI 原生数据、扩散语言模型与多智能体 1. DB-GPTAI 原生数据应用开发框架GitHub: eosphoros-ai/DB-GPT超 1.7w★定位大模型数据库的下一代应用基础设施关键能力多模型管理SMMF、Text2SQL 强化、GraphRAG、Multi-Agents 协作支持多数据源数据库、数仓、文件、多类型知识库构建应用场景智能 BI、自然语言数据分析、企业知识助手活跃度2025 年持续更新 GraphRAG、VSAG 集成数千用户高度活跃 2. LLaDA2.0首个 100B 扩散语言模型GitHub: inclusionAI/LLaDA2.0约 218★发布时间2025 年 12 月特点16B/100B 双版本MoE 架构从 AR 模型“平滑转化”再训练实现代码/数学/推理任务性能超越同级自回归模型活跃度2025 年 12 月开源Star 爬升中周边工具持续更新 3. VSAG高性能向量检索索引库GitHub: antgroup/vsag约 439★定位专为相似度检索设计的 C 向量索引库亮点内存占用及查询性能优化优于传统 HNSW已集成 DB-GPT 与蚂蚁自研图数据库活跃度2025 年 11 月仍有 ReleaseIssue/PR 活跃中高活跃 4. CodeFuse 生态代码大模型工具链代表项目CodeFuse-CGM图结构驱动的代码生成模型CodeFuse-Query基于 Query 的大规模代码分析引擎CodeFuse-IDE基于 CodeFuse OpenSumi 的 AI Native IDE活跃度2025 年 NeurIPS 等顶会新论文GitHub 持续更新生态活跃 5. AWorld动态多智能体系统GitHub: inclusionAI/AWorld约 1.1k★定位构建、评估和训练通用 Multi-Agent 系统技术亮点IM0 任务 6 小时内复刻 DeepMind 模型 5/6 道金牌解题结果支持纯自然语言推理与 Workflow 组合构造协作策略活跃度2025 年 8 月论文与 GitHub 同步发布Star 破千高度活跃 6. agentUniverse面向金融的多智能体框架GitHub: agentuniverse-ai/agentUniverse约 2k★定位大模型多智能体框架服务金融与企业级复杂业务特点提供多智能体协作编排组件内置多种协作 pattern支持“拿来即用”或自定义模式活跃度2025 年持续 Release 与文档更新活跃 7. EchoMimic 系列让静态人像“对口型、带表情”GitHubantgroup/echomimicV1约 4.2k★antgroup/echomimic_v2V2约 4.4k★antgroup/echomimic_v3V3约 691★定位基于语音驱动的肖像动画生成系列模型技术演进V1可编辑关键点 语音驱动V2效果提升 半身动作支持V31.3B 参数保真度突破生态ComfyUI 插件、Jupyter Demo、Pinokio 脚本等活跃度2025 年全年持续生态扩展高度活跃⚙️ 四、其它阿里系开源联邦学习、Java Agent 框架等 1. FederatedScope联邦学习平台GitHub: alibaba/FederatedScope约 1.5k★定位支持大规模高效率异步训练的联邦学习平台活跃度2025 年仍被达摩院推荐Repo 持续更新活跃 2. Spring AI AlibabaJava 世界的 Agentic AI 基础设施GitHub 生态spring-ai-alibaba/examples约 2.2k★spring-ai-alibaba/spring-ai-alibaba-admin约 335★定位为 Java 开发者提供 Agentic AI 框架与运行时能力多模型接入通义、第三方 LLMAgent 工作流编排、观测与评估活跃度2025 年 12 月仍有 Commit 活动与 DeepResearch 集成持续更新中高活跃 3. TePDist、EasyNLP 等基础设施项目TePDistalibaba/TePDist约 99★HLO 级自动分布式训练系统EasyNLPalibaba/EasyNLP约 2.2k★综合 NLP Toolkit活跃度社区仍有使用与 Issue 互动持续活跃 五、整体观察与开发者选型指南✅ 1. Star 热度分布万级 Star 阶梯Qwen3 主线 / Coder / VL、WebAgent / DeepResearch、DB-GPT → 开源 LLM Agent AI 数据应用第一梯队5k–10k 阶梯EchoMimic 系列、FunClip、Qwen2.5-VL / Qwen-Agent、Qwen-Code → AI 应用层 工程支撑层爆款1k 阶梯Rynn 系列、VideoLLaMA3、AWorld、agentUniverse、VSAG、Qwen3-Embedding → 具身智能、视频理解、多智能体、向量检索关键基础设施✅ 2. 2026 项目选型清单方向必看项目组合为什么具身智能/机器人RynnRCP RynnVLA-001/002 RynnEC覆盖物理建模→动作生成→协议适配整条链路视频/多模态理解VideoLLaMA3 Qwen2.5-VL / Qwen3-VL通用理解 细粒度时空物体分析可搭配 VideoReferWeb Agent 产品WebAgent DeepResearch Qwen3 系列端到端流水线已跑通Java 体系用 Spring AI Alibaba 集成数据库大模型DB-GPT VSAG Qwen3-Embedding企业级落地标配GraphRAG 处理复杂知识图谱多智能体框架AWorld / agentUniverse Qwen3 主线金融/企业复杂业务用 agentUniverse通用场景用 AWorld 工作流设计数字人/互动形象OpenAvatarChat EchoMimic/V2 Qwen3-Omni轻量闭环快速搭建追求高保真叠加 EchoMimic-V3✅ 3. 三个关键判断从“模型竞赛”到“Agent 体系竞赛”2025 年阿里系最热项目全在 Agent / Multi-Agent 方向WebAgent、DeepResearch、DB-GPT具身智能从“Demo”走向“可复现系统”Rynn 系列让论文可复现工业界信号明确数据管道是生死线DB-GPT、VSAG 证明没可靠检索基建LLM 难落地 六、写在最后2026 年做 AI 应用阿里系开源“积木”怎么用“2026 年做 AI 应用门槛不是‘能不能用大模型’而是‘能不能合理使用开源积木上搭出生产级系统’。”最底层算力与模型底座通用大模型Qwen3 主线 / Qwen2.5 主线多模态模型Qwen3-VL / Omni、VideoLLaMA3、Rynn 系列嵌入与检索Qwen3-Embedding / Qwen3-VL-Embedding VSAG中间层工程基础设施分布式训练TePDistNLP/ML 工程支撑EasyNLP、FederatedScope数据 RAG WorkflowDB-GPT、AWorld、agentUniverse、Qwen-Agent上层应用完整系统样板Web 智能体WebAgent、DeepResearch数据智能应用DB-GPT 企业自有数据多智能体业务编排AWorld / agentUniverse数字人互动OpenAvatarChat EchoMimic / Qwen3-Omni如何学习AI大模型如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】这是一份大模型从零基础到进阶的学习路线大纲全览小伙伴们记得点个收藏第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。100套AI大模型商业化落地方案大模型全套视频教程200本大模型PDF书籍学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。LLM面试题合集大模型产品经理资源合集大模型项目实战合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】