Momenta世界模型算法实习生（视频生成方向）

实习兼职研发2026-03-24地点：北京 | 上海 | 苏州 | 深圳状态：招聘

扫码手机上打开

任职要求

1、计算机科学/人工智能/机器人/自动化等相关专业硕士及以上学历，博士优先；
2、在自动驾驶/机器人等对时空一致性要求较高的任务中有实际应用经验者优先；
3、有Diffusion Model/自回归时序模型或世界模型相关研究与实践经验优先；
4、扎实的编程能力，熟练使用 Python/C++，具备良好的数据结构与算法基础；
5、熟悉主流深度学习框架(PyTorch等)，并对模型训练、优化与工程实现有深入理解;
6…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、主导研发具备时空一致性的端到端智驾大模型(World Model)，聚焦视频生成相关技术落地，支撑环境建模、未来预测与策略评估等核心任务；
2、结合Diffusion/自回归等生成式模型，提升真实交通场景下的多模态预测、不确定性建模精度与鲁棒性；
3、泛化端到端模型性能，重点解决在长时序、复杂交互场景中的时空连贯性问题，保障模型的稳定性与泛化能力；
4、负责端到端模型在L4无人物流场景的规模化落地，推动技术从研发到实际应用的转化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

自动驾驶+

Python+

C+++

数据结构+

算法+

深度学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

基座模型-大模型算法实习生-视频生成方向-北京

实习算法与软件

1. 探索多模态理解与生成、3D生成、视频生成、强化学习等前沿技术； 2. 利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，研发以人工智能技术为核心的新技术、新产品。

北京

世界模型算法实习生

实习

参与团队在世界模型(world model)，视频生成模型,3D/4D生成模型等相关方向大模型的研发。同时结合自研产品需求,深度参与模型在公司相关场景的应用落地。 1、负责相关大模型算法的设计、开发和优化，提高模型的性能和精度; 2、负责模型的训练、测试、验证和部署,保证模型的稳定性和可靠性; 3、负责模型的监控和维护,及时发现和解决模型的问题; 4、参与团队的技术交流和分享,提高团队的技术水平。

更新于 2025-11-20深圳

世界模型算法实习生（实时交互方向）

实习算法序列

【岗位职责】 1、根据个人技术背景与兴趣，你将重点参与并攻坚以下一项或多项核心工作，完成核心算法的优化探索，并在指导下冲击顶级学术会议（CVPR / ICCV / NeurIPS / ICLR 等）： 2、长时序生成：深入探索实时可交互视频生成范式，参考并改进Self-forcing, Helios 等前沿架构，突破超长时序环境生成的质量和一致性瓶颈。 3、实时交互与加速：研究并应用 DMD2 等前沿模型蒸馏与加速算法，大幅降低视频生成延迟，实现毫秒级的基于动作（Action-conditioned）的闭环环境响应。 4、通用视觉表征构建：负责 VAE 等底层表征模型的探索与深度优化，大幅提升图像/视频特征的重建质量与时空压缩率，为世界模型构建高保真、强泛化性的通用视觉表征。 5、架构设计与优化：参与交互式世界模型的底层架构设计、模型训练与工程优化，支持自动驾驶端到端算法的仿真验证。

更新于 2026-03-30北京|上海|香港

视觉研究型算法实习生

实习实习生

聚焦探索实时可交互视频生成方向，产出高水平学术成果与影响力技术落地。专项课题：研究方向一：实时视频生成范式探索 1. 实时视频生成范式的探索，系统性验证AR或AR+Diffusion视频生成方案； 2. 尝试垂直领域AR生成范式和AR生成范式在数据上的scaling law和智能涌现能力； 3. DiT视频生成效率提升，包括但不限高效率、低精度损失、高压缩比的视频VAE和tokenizer、包括稀疏架构、MoE等DiT结构探索。研究方向二：长视频生成的一致性保持 1.DIT范式，AR范式和 AR + DiT范式下的视频生成记忆框架实现与调研，包括但不限于3D 世界模型表征记忆，预测帧缓存与重用机制和用户状态与意图记忆等； 2.基于隐式视觉记忆机制（跨时间追踪关键环境状态），探索无需显式3D建模的动态场景表征，支持对场景物体、光照、环境的长期记忆存储与检索。

更新于 2025-08-13上海