米哈游【实习】视频生成强化学习算法工程师
实习兼职程序&技术类地点:上海状态:招聘
任职要求
1、硕士及以上学历,计算机科学、电子工程、人工智能等相关专业; 2、2年以上图像/视频生成、强化学习或其他计算机视觉相关领域工作经验; 3、具备出色的编程与算法实现能力,熟练掌握主流深度学习框架(如 PyTorch),并拥有熟练的模型训练与调优经验; 加分项 1、熟悉扩散模型及其不同变体,如 Score Model、DDPM、DDIM、Flow Matching 等,了解 SDE、ODE 等理论范式; 2、作为核心作者在顶级机器学习/视觉/图形学会议或期刊(如 CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR、SIGGRAPH)发表过高水平论文; 3、具备大规模分布式模型训练的实际经验; 4、在开源社区(如 GitHub)有影响力项目的贡献经历; 5、具备强烈的自我驱动力、优秀的团队协作能力,以及对前沿技术挑战的极大热情;
工作职责
负责视频生成模型在后训练/强化学习阶段的算法研发与模型训练,运用前沿强化学习算法优化模型的稳定性与视频生成质量,并实现对人类专家审美偏好的深度对齐。 核心职责 1、深入研究前沿强化学习算法,负责视频生成任务中的基于强化学习的优化方案探索及训练框架搭建; 2、结合视频生成模型的效果短板,分析强化学习算法的优化目标,设计数据收集方案; 3、设计并实现面向视频生成的多目标强化学习算法,设计并训练奖励模型(Reward Model); 4、撰写高质量技术报告与论文,与团队共同推动技术创新,保持行业领先地位。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
NeurIPS+
https://neurips.cc/
ICML+
https://icml.cc/
ICLR+
https://iclr.cc/
GitHub+
[英文] GitHub Learn
https://learn.github.com/
Discover a wide range of beginner-friendly tutorials, hands-on learning, and expert-led lessons.
相关职位
实习J1003
1. 负责LLM&图像生成&视频生成&动作生成&语音生成&多模态生成&强化学习&路径规划等相关算法的开发和研究; 2. 负责将相关算法模型进行部署和优化,并完成与相关需求部门的接口对接; 3. 负责游戏环境中相关AI需求发掘、设计、技术研发,以及推动上线落地和不断迭代优化; 4. 关注AIGC业界动态,关注AI与游戏结合的新方向,引入前沿的技术和方法,参与团队基础研究能力。
更新于 2025-06-24
实习淘天集团研究型实
我们是阿里妈妈智能创作与AI应用团队, 长期从事利用CV NLP等多模态和多媒体技术进行内容创作、内容理解的算法工作,团队耕耘技术多年,在电商创意素材生成领域 有广泛的业界影响力,研发出阿里妈妈创意中心、万相实验室等产品以及阿里妈妈智能图片制作(Auto Poster)、阿里妈妈视频生成(AtomoVideo)等技术,研究成果发表在 CVPR、ICCV、AAAI、ACM MM、WWW、ACL 等学术顶会。 我们诚挚欢迎你加入团队,工作内容为下列之一: 1. 需要1年Diffusion Models扩散图像生成经验(强相关)。1年图像领域相关经验。 2. 需要在广告 或者 电商 场景的图像算法应用经验。 3. 需要在图像生成方向有顶会论文,CVPR,ECCV,NIPS,MM。
更新于 2025-09-08
实习
1、参与图像、视频生成相关领域研发工作,探索视觉生成领域前沿方向 2、参与图像画质增强、视频可控生成、多模态视觉生成、视觉生成领域强化学习等方向研究 3、分析和解决算法产品化过程中出现的效果、性能等问题 4、参与学术研究,产出影响行业的科研成果
更新于 2025-05-23