美团【基座大模型北斗实习】视觉生成与世界模型技术研究
实习兼职核心本地商业-基础研发平台地点:北京 | 上海 | 深圳状态:招聘
任职要求
1、熟悉扩散模型、VAE等相关研究进展;
2、熟悉PyTorch,有充分的动手实践经验。
加分项:
1、有图像/视频生成、Video-based世…登录查看完整任职要求
微信扫码,1秒登录
工作职责
简介:参与视觉生成与世界模型方向的前沿研究,可根据个人背景和研究兴趣选择以下方向之一深入推进: 1、高效率、低损失、高压缩比的图像视频 VAE 和 tokenizer 研究。 2、统一生成模型的架构、训练与推理探索(稀疏架构、大尺寸 MoE、自回归生成等)。 3、功能模型研究,包括参考生成、长视频生成、流式实时视频生成、音视频生成等。 4、隐式世界模型、WorldActionModel 及 Action-conditioned WorldModel 的方法研究。 5、世界模型在具身智能、实时交互等场景中的应用探索。 6、其他你坚信路线正确的视觉生成与世界模型前沿方向。
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
ICLR+
https://iclr.cc/
还有更多 •••