通义研究型实习生 - 基于生成理解一体化的前沿具身智能大模型和数字人大模型
任职要求
1. 计算机科学、人工智能、机器人学、自动化、人机交互或相关专业在读博士研究生; 2. 扎实的深度学习与大模型基础,熟悉Transformer、扩散模型、自回归生成、多模态对齐等核心技术; 3. 熟练掌握Python,具备PyTorch/JAX等框架下的模型训练…
工作职责
我们是通义实验室多模态交互团队,正在寻找对具身智能与数字人前沿交叉领域充满热情的研究型实习生。本项目在团队在生成理解一体化方面的坚实基础(如Z-Image等代表性工作),共同构建下一代具身智能与多模态数字人大模型,进一步打通“感知-理解-生成-执行”全链路,在统一架构下探索环境理解、行为生成与多模态交互的深度协同。 你将参与如下关键方向: 1. 设计并实现支持自然语言指令到连续动作序列端到端控制的生成理解一体化具身基础模型; 2. 构建能响应语音、文本、视觉等全模态输入,实时高质量数字人生成大模型; 3. 开发融合真实与仿真数据的千万级多模态具身训练平台; 4. 优化模型推理效率,推动大模型在机器人端侧或实时交互场景中的部署。 优秀成果可形成专利/论文,或发布通义开源社区
【加入前沿战场,定义下一代增长引擎】 在阿里妈妈AI Agent与客户成长团队,我们正用最前沿的Agent技术重构数智化营销生态。 作为团队新生力量,你将直接参与构建日均服务百万级商家的智能增长系统,通过大模型技术实现从用户意图洞察到智能决策的全链路突破。 在这里,你的代码将直接影响中国电商生态的广告决策效率,用AI重新定义商业增长的可能性。 【你将主导的挑战】 智能增长系统攻坚 ● 设计基于LLM的个性化增长策略矩阵,覆盖智能触达、流失预警、投放引导等核心场景。 ● 构建多模态商业理解引擎,融合时序预测(LTV建模)、因果推断(Uplift建模)、生成式优化等创新技术。 ● 主导端到端的AI Agent架构设计,攻克动态Prompt生成、多轮对话决策等关键技术节点。 数据驱动的技术突破 ● 操盘亿级用户行为数据,通过大规模A/B实验验证模型效果,你的每个优化将直接提升DAU/留存率等核心指标。 ● 探索大模型微调+RAG+Agent框架的技术融合,打造行业领先的智能运营解决方案。 【超维成长体验】 三位一体培养体系 ● 双导师制成长:算法大牛+业务专家贴身指导,定期论文精读与代码Review。 ● 全真项目历练:独立负责子模块开发,6个月挑战完整项目生命周期。 ● 前瞻技术视野:参与内部技术峰会,第一时间获取阿里妈妈AI最新研究成果。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;