蔚来数据生成算法工程师
社招全职3-5年数字技术地点:上海 | 北京状态:招聘
任职要求
任职要求 计算机、自动化、人工智能等相关专业硕士及以上学历。 扎实掌握深度学习基础,熟悉 Transformer、Attention、VAE、Diffusion、Flow Matching 等模型。 熟练使用 Python、PyTorch、CUDA,具备大规模训练经验。 熟悉视频生成、多模态大模型、智能辅助驾驶感知预测规划中的至少一个方向。 熟悉 Megatron、DeepSpeed、FSDP、Ten…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责视频世界模型(World Model)研发,包括数据构建、预训练、后训练与评测体系建设。 研究并实现 Diffusion、Flow Matching、AR Transformer、Video VAE 等生成模型。 构建可控场景生成能力,实现天气、光照、交通参与者行为、Ego轨迹等因素编辑与生成。 探索 World Model 在智能辅助驾驶仿真、闭环评测、数据生成、VLA/WAM 等方向的应用。 负责大规模视频训练与推理优化,包括分布式训练、模型压缩和推理加速。 跟踪学术前沿,复现并改进相关工作,如 Sora、Cosmos、Genie 2、OmniDreams 等。
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••