logo of meituan

美团【基座大模型北斗实习】视觉生成与世界模型技术研究

实习兼职核心本地商业-基础研发平台地点:北京 | 上海 | 深圳状态:招聘

任职要求


1、熟悉扩散模型、VAE等相关研究进展;
2、熟悉PyTorch,有充分的动手实践经验。

加分项:
1、有图像/视频生成、Video-based世…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


简介:参与视觉生成与世界模型方向的前沿研究,可根据个人背景和研究兴趣选择以下方向之一深入推进:
1、高效率、低损失、高压缩比的图像视频 VAE 和 tokenizer 研究。
2、统一生成模型的架构、训练与推理探索(稀疏架构、大尺寸 MoE、自回归生成等)。
3、功能模型研究,包括参考生成、长视频生成、流式实时视频生成、音视频生成等。
4、隐式世界模型、WorldActionModel 及 Action-conditioned WorldModel 的方法研究。
5、世界模型在具身智能、实时交互等场景中的应用探索。
6、其他你坚信路线正确的视觉生成与世界模型前沿方向。
包括英文材料
PyTorch+
还有更多 •••