小红书基础模型算法实习生
任职要求
1、本科及以上学历,计算机、人工智能、电子信息、自动化、软件或数学等相关专业; 2、在机器学习,人工智能,数据挖掘,统计学,最优化理论等领域有深厚的积累; 3、编程基本功扎实,熟悉常用的数据结构和算法,擅长Pytorch和Tensorflow编程框架优先,有ACM竞赛金牌优先,有LLM结构优化经验优先; 4、踏实勤奋,自我驱动,善于沟通,勤于思考,有持续学习新知识的能力,有较强的逻辑思维能力,抽象、概括和总结能力,对于技术有热情; …
工作职责
团队负责小红书生成式推荐方向,目前已经完成了原型架构的开发和线上验证,欢迎有能力、有热情的同学一起,共同探索生成式推荐和多模态大模型在真实业务场景的价值。

负责研发多模态基础模型,可处理图像,文本,语音等多模态数据,负责网络结构框架的整体设计和优化。 * 负责探索多模态领域内的最新研究成果和技术进展,熟悉BLIP, LLaVA, mini-GPT4等多模态模型。 * 构建和维护多模态数据集,负责多模态大模型的业务落地和推广
- 模型能力优化:面向百度搜索业务进行基础模型优化,包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作 - 模型成本优化:通过优化 MoE 路由策略、Latent Attention 结构优化等手段,提升推理效率,降低部署成本 - 算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR 等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步 - 跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地

我们致力于打造面向真实物理世界的生成式世界模型,依托Momenta海量真实物理交互数据,聚焦先进模型架构设计与大规模Scaling,构建具备物理一致性、长时序推理与可交互能力的下一代AI 基础模型。团队覆盖视频生成、多模态统一理解与生成、VLA、端侧Policy Model、离线Sim2Real全链路,提供行业最一线、最核心的研发机会,推动技术从模型创新到Physical AI在真实场景落地。 1、负责高保真、物理自洽视频生成世界模型研发。包括扩散模型、时序建模、长视频生成、高性能多模态表征探索与推理优化算法研发和前沿探索,构建可预测、可交互、具备物理约束的生成式世界模型; 2、深耕世界模型前沿架构设计,探索物理世界的Scaling Law。推进模型架构往理解生成统一,MoE/MoT等前沿架构演进。结合大规模真实数据,推进模型工程化、性能极致化与规模化迭代; 3、参与端侧Policy Model与离线Sim2Real全链路研发,打通仿真生成与真实世界决策闭环,支撑自动驾驶等核心场景落地。