东莞网站建设网站建设服务商英文
2026/6/20 6:58:50 网站建设 项目流程
东莞网站建设网站建设,服务商英文,聚合猫网站建设,网站稳定性本文详细记录了作者在淘天、字节、商汤等多家科技公司大模型部门的面试经历#xff0c;涵盖多模态模型、OCR技术、高分辨率处理等核心领域的技术问题。文章分享了各公司的面试特点、常见技术难题及应对策略#xff0c;同时提供了HR面试注意事项和offer选择建议#xff0c;为…本文详细记录了作者在淘天、字节、商汤等多家科技公司大模型部门的面试经历涵盖多模态模型、OCR技术、高分辨率处理等核心领域的技术问题。文章分享了各公司的面试特点、常见技术难题及应对策略同时提供了HR面试注意事项和offer选择建议为准备大模型岗位的求职者提供了全面实用的参考指南面试情况投过的公司淘天字节蚂蚁商汤美团夸克腾讯minimax零一万物阿里控股潞晨科技阿里巴巴国际网易实验室Momenta。Offer淘天字节AML商汤蚂蚁美团夸克腾讯混元天翼云。以下是面经分享淘天【offer】部门未来生活实验室介绍:淘天集团的大模型研究将主要围绕两个场景展开一是搜广推二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。面经一面• 如何训练ocr任务• 实验的setting• ocr任务影响如何• 高分辨率训练再在小分辨率上会不会崩掉• 输出bbox有没有好的方式HR面• 基本信息确认• 考研进入电子科技大为什么• 为什么进入了诺亚• 代表性的工作• 如何解决问题的国内在做语言大模型的多一些。• 国内在做多模态大模型的• 如何评测评估这些大模型的。如何看待刷榜的问题。• 你们的衡量指标面试体验面试体验很好。HR也没有那么咄咄逼人。阿里味不是特别明显。最终权衡也选择来了淘天有兴趣来我们这边的欢迎投递简历有卡****张。字节AML【offer】部门AML火山方舟大模型介绍淘天集团的大模型研究将主要围绕两个场景展开一是搜广推二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。预备面经猎头也提供了一些其他候选人的面经 整理如下• 设计一个Hash表• 蓄水池问题• 从超大文本文件中随机行采样• 二叉搜索树-去掉超出[m, n]范围内的节点• 计算交叉熵• 计算IOU一面• 多模态你们的流程• 你们的OCR的结构• layernorm的区别二面• 什么时间开始做多模态模型• 目前在文档• Token长度太大。高分辨率如何解决。• patch能不能变得• VQGAN• GPT4V的结构形式。• LLM decoder• MagViT• LLM的基础知识需要尽快补上三面• 自我介绍• 多模态大模型用哪个模型• Transformer比较熟悉• python实现self attention和Transformer面试体验字节一如既往的注重coding基本每一面两道题自己能拿到offer也算是运气吧。一面的面试体验很差可以说是毫无面试经验的面试官。商汤【offer】一面• 简单的自我介绍• 关于高分辨率的解决办法• OCR是如何去做的有没有groundingReferring• GPT4V 位置检测明显的问题• 你们是如何解决位置信息的• 新的模态进来如何去拼接过来• 新来一批数据如何训练• tree1是否是tree2的子树二面• AGI缺不了视觉• 工业场景人的检测奇怪的零件机器的检测。检测的结果需要理解人的行为。理解和context的关系。人和环境的关系。借助多模态来解决• 自驾感知端到决策端感知不需要全面的感知着重额感知需要• 假新闻图是真的。caption场景• OCR街景的OCR文档网页截图等是不同的这些场景混在一起。会有影响吗• OCR的方案一般是先出检测框再出文本。不规则的文本如何解决• 多模态大模型的OCR• Qwen-VL的文本检测形似是否合理• 模型本身的三种能力• 自己的能力认识什么• LISA借助decoder来做用新的prompt来实现分割。】• 外挂RAG等。• 判断左右括号等组成的字符串是否是合法的二面结束问题不大。三面• Leader面聊了一些有的没的面试体验面试过程很专业毕竟是商汤算法技术是国内领先的奈何没产品而且薪资包也没有诚意。蚂蚁风控大模型【offer】一面• 自我介绍• 介绍Focus-DETR有没有在业务中应用。二面• 介绍• 目前在做的事情• 下游的任务文档场景再做一个什么任务• ocr数据是如何生成的• 效果如何• 如何解决幻觉的问题HR面• 具体的工作内容印象• 安全内容tob的内容审核。竞对。• 个人介绍。• 上海海思为什么跳槽• 算法支撑MiniMax【挂】一面• 空间感知能力是如何解决的• 不同token长度是否有做balance的方式• 很多有价值的问题。• python实现标题 MLP Regressor 题目描述 题目描述与要求:实现一个MLP regressor 的完整训练过程包括:forward , backward , SGD更新参数;验证backward梯度正确性;构建数据验证端到端正确性 (收敛泛化);(optional) 参考你过往的实验经验尽可能让功能更完善;不使用第三方库中已实现好的自动求导方法;P.S. 实现方法不限但由于在线IDE运行环境不稳定推荐使用numpy。PS面试官对算法底层了解比较深入比较考验代码能力不是字节那种。零一万物【挂】一面• 多模态的情况。• document的难度。• 手写 self attention二面• 自我介绍• 传统的OCR模型和多模态大模型的区别• 带不带OCR多模态文档智能差多少。• 未来OCR模型是否会被大模型吃掉。OCR大模型有什么是做不了的。• 在哪些模型上做过一些预训练。• 多模态未来怎么做。• EVA的有趣的现象。没有出现涌现的现象。• 后面的工作主要集中在哪里。• 怎么训练比较好gemini那种形式llm那种形式。**PS**问了很多开放性的问题给的回复是业务积累不够hhhh。美团【offer】一面• 文档大模型是一个独立的模型会整合到一个大模型还是分离式的。• 不考虑通用场景的。• 目前用的多大的模型。• 是一个什么结构。对结构的一些了解。• flamingo或者blip2的结构上的对比。• 足够资源的情况下哪个结构是最优的。• 分辨率是如何解决的。文档的分辨率比较高。• QA对匮乏如何解决的。• ocr的性能目前是低于多模态大模型。• 如何解决bbox感知能力差的问题。• 充足的算力。数据如何获取。如何有效的清洗。• fuyu这种结构有什么优化的空间。二面• OCR文档大模型• Instruction tuning的决定性因素哪些Instruction tuning策略效果更好。如何评估复杂度的性能。• 如何保证数据集的多样性和复杂度。• 分层的Instruction tuning。• 数量的影响。数量和质量。• 不同类型数据的影响。对下游任务的影响。自动化的数据配比。自动化的指标去做类似的事情。• 专门优化的指标不再是一个好的指标。• 使用其他的指标来引导模型的优化而不是使用下游的指标。LLM使用的loss作为指标。而不是benchmark的分数。• 合理的评估指标是什么。openAI的压缩理论trainnig loss代表优化目标。• AGI的几个阶段deepmind发表。三面• 各种问题四面• 介绍自己。• 有一个多模态大模型具备一些很多baseline的效果基础的CV能力。可能效果都不是特别好。不如专精的大模型。OCR为例。目标得到一个类似GPT4V的模型整理提高模型的效果。第二个全流程强化ocr能力。已有的多模态大模型。• 文档场景。阿里控股【PASS】一面这里没什么面经整体面试体验很差。不考虑继续往下面。• 人非常高傲傲慢问问题满脸的嫌弃• 感觉别人都不行• 觉得自己很强• 文生图• 文生图的畸形检测的方式。潞晨科技【PASS】一面• 手写self-attentionemmm但凡面试官是NLP的面试体验都不太好。如果NLP背景的面试官面试会比较困难。夸克【offer】一面• 项目• 做题二面• 高分辨率的解决方案• 重叠文本框。采用什么方案来解决。• 端到端的OCR是怎么做的。三面• 介绍Focus-DETR。• 介绍端到端的OCR。• 介绍多模态大模型。• 小语种数据集采购是为什么。检测数据多了识别数据少了。介绍业务规划偏传统业务不是大模型方向。四面大佬面出了一个概率题。HR面• 为什么跳槽。• 职业规划。• 为什么有这个绩效和各种奖项。腾讯-混元大模型【offer】一面• 简单描述简历在做的东西• 图像细节提取有什么办法• 目前的进展是什么样的项目进展到什么情况• 表格这种数据如何解决如何对表格这种做有效的信息抽取。• 目前有多少的数据量二面• OCR算法• 项目• 介绍文本检测的一些问题如何解决• MAE如何优化什么鬼问题三面纯聊天没有太多技术问题。• 多模态大模型TEG数据平台事业部。混元大模型。机器学习平台。阿里巴巴国际部【中止】一面• 题目旋转图像 Alpha度• 介绍项目• 介绍Focus-Detr。二面• 简单询问项目很快结束。PS不靠谱很久没消息。没有后续的任何回复。这种最恶心了建议大家不要再投。网易实验室【PASS】一面• 自我介绍• 剪枝的工作Focos-DETR是如何剪枝的。• Transformer相比CNN相比RNN的优势。• 训练推理增加吞吐量。• 推理加速。预训练模型的部署推理优化。做推理加速的不合适。Momenta【PASS】一面• 手写NMS• 介绍DETR• 介绍Focus-DETR• 介绍position Embedding• 介绍DETR里面query的含义PSMomenta属于给钱多但是比较累的。以后不太想做自动驾驶了所以pass。不再考虑。蚂蚁【大模型-codefuse】【HR面挂】一面简单聊项目二面• 业务题如何解决多页文档的问题• 业务题现在 ui 多模态大模型ocr 如何引入目前 ocr 存在很多问题• leetcode 题目字符串转数字• leetcode 题目最大子数组和• 多模态大模型的基础知识三面• 个人介绍• 部门规模• 论文的情况• 换过部门• 海思做的内容• OCR成熟度很高面试体验面试官都很专业问了很多问题感觉很强。在HR面上吃了亏很多问题没有回答好吸取了经验很多问题调整了回答的方式。也反思了自己在过往工作中存在的问题面对大公司建议HR面认真准备看看网上的一些经验阿里的HR有一票否决权。HR面注意点1、跳槽动机如果是因为晋升不上去看机会建议这么说内部机会少太稳定想看更有发展的机会别直接说晋升不上去才看机会⚠切勿说和leader处不来或者说目前leader坏话。2、关于薪资可以回答看企业安排或者回答一个区间保底多少期望多少加一句薪资可谈留足谈判空间如果企业给的薪资不太满意⚠别直接拒绝就说考虑一下我这边去谈最后面试结束时记得感谢下面试官的时间。3关于加班大厂都大差不差HR问就是试探⚠切勿说接受不了。一些参考社招关于大模型的知识点问到的也是一些常识知识没有特别难得更多的还是项目为主。面试其他公司的时候基本没有刷题因为工作期间面试的没有太多时间刷题 只能周末时间。为了准备字节还是刷了一些题大概60多道如果是字节的话还是好好准备刷题 我有朋友甚至遇到了好几道hard。关于刷题推荐labuladong的刷题笔记。应该算是最精良了看这个不用看其他的了。选择offer过程中也是各种权衡考虑很多因素也咨询了很多朋友面临offer选择困难的朋友也可以咨询作者本人。小白/程序员如何系统学习大模型LLM作为在一线互联网企业深耕十余年的技术老兵我经常收到小白和程序员朋友的提问“零基础怎么入门大模型”“自学没有方向怎么办”“实战项目怎么找”等问题。难以高效入门。这里为了帮助大家少走弯路我整理了一套全网最全最细的大模型零基础教程。涵盖入门思维导图、经典书籍手册、实战视频教程、项目源码等核心内容。免费分享给需要的朋友扫码免费领取全部内容1、我们为什么要学大模型很多开发者会问大模型值得花时间学吗答案是肯定的——学大模型不是跟风追热点而是抓住数字经济时代的核心机遇其背后是明确的行业需求和实打实的个人优势第一行业刚需驱动并非突发热潮。大模型是AI规模化落地的核心引擎互联网产品迭代、传统行业转型、新兴领域创新均离不开它掌握大模型就是拿到高需求赛道入场券。第二人才缺口巨大职业机会稀缺。2023年我国大模型人才缺口超百万2025年预计达400万具备相关能力的开发者岗位多、薪资高是职场核心竞争力。第三技术赋能增效提升个人价值。大模型可大幅提升开发效率还能拓展职业边界让开发者从“写代码”升级为“AI解决方案设计者”对接更高价值业务。对于开发者而言现在入门大模型不仅能搭上行业发展的快车还能为自己的职业发展增添核心竞争力——无论是互联网大厂的AI相关岗位还是传统行业的AI转型需求都在争抢具备大模型技术能力的人才。人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议2、大模型入门到实战全套学习大礼包分享最后再跟大家说几句只要你是真心想系统学习AI大模型技术这份我耗时许久精心整理的学习资料愿意无偿分享给每一位志同道合的朋友。在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。部分资料展示2.1、 AI大模型学习路线图厘清要学哪些对于刚接触AI大模型的小白来说最头疼的问题莫过于“不知道从哪学起”没有清晰的方向很容易陷入“东学一点、西补一块”的低效困境甚至中途放弃。为了解决这个痛点我把完整的学习路径拆解成了L1到L4四个循序渐进的阶段从最基础的入门认知到核心理论夯实再到实战项目演练最后到进阶优化与落地每一步都明确了学习目标、核心知识点和配套实操任务带你一步步从“零基础”成长为“能落地”的大模型学习者。后续还会陆续拆解每个阶段的具体学习内容大家可以先收藏起来跟着路线逐步推进。L1级别:大模型核心原理与PromptL1阶段将全面介绍大语言模型的基本概念、发展历程、核心原理及行业应用。从A11.0到A12.0的变迁,深入解析大模型与通用人工智能的关系。同时,详解OpenAl模型、国产大模型等,并探讨大模型的未来趋势与挑战。此外,还涵盖Pvthon基础、提示工程等内容。目标与收益:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为AI应用开发打下坚实基础。L2级别RAG应用开发工程L2阶段将深入讲解AI大模型RAG应用开发工程,涵盖Naive RAGPipeline构建、AdvancedRAG前治技术解读、商业化分析与优化方案,以及项目评估与热门项目精讲。通过实战项目提升RAG应用开发能力。目标与收益:掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。L3级别Agent应用架构进阶实践L3阶段将 深入探索大模型Agent技术的进阶实践,从Langchain框架的核心组件到Agents的关键技术分析,再到funcation calling与Agent认知框架的深入探讨。同时,通过多个实战项目,如企业知识库、命理Agent机器人、多智能体协同代码生成应用等,以及可视化开发框架与IDE的介绍,全面展示大模型Agent技术的应用与构建。目标与收益:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。L4级别:模型微调与私有化大模型L4级别将聚焦大模型微调技术与私有化部署,涵盖开源模型评估、微调方法、PEFT主流技术、LORA及其扩展、模型量化技术、大模型应用引警以及多模态模型。通过chatGlM与Lama3的实战案例,深化理论与实践结合。目标与收益:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。2.2、 全套AI大模型应用开发视频教程从入门到进阶这里都有跟着老师学习事半功倍。2.3、 大模型学习书籍文档收录《从零做大模型》《动手做AI Agent》等经典著作搭配阿里云、腾讯云官方技术白皮书帮你夯实理论基础。2.4、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。2.5、大模型大厂面试真题整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题涵盖基础理论、技术实操、项目经验等维度每道题都配有详细解析和答题思路帮你针对性提升面试竞争力。【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】2.6、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询