logo of kuaishou

快手视频生成强化学习算法专家 -【可灵AI】

社招全职3-5年D13914地点:北京状态:招聘

任职要求


1、在以下至少一个方向有深厚的项目经验和技术洞察力:生成模型、多模态学习、强化学习、模型对齐;
2、在以下至少一个AI领域有丰富的知识积累和前沿视野:大规模生成模型,多模态AI,计算机视觉、视频理解/生成等;
3、具备出色的编程能力和算法实现能力,熟悉主流深度学习框架(如PyTorch),并有大规模模型训…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责视频生成大模型以及多模态控制的视频生成的强化学习算法研究与开发,优化模型训练效果、稳定性和效率;
2、深入研究前沿的强化学习算法,结合可灵视频生成业务场景,探索和落地新的算法优化方向,保持公司在该领域的技术领先性;
3、深入研究面向视频生成的多目标强化学习及奖励模型(Reward Model)设计,提升模型在复杂任务中的表现;
4、撰写高质量技术报告与论文,与团队共同推动技术创新,保持行业领先地位。
包括英文材料
强化学习+
OpenCV+
算法+
深度学习+
PyTorch+
还有更多 •••
相关职位

logo of liauto
社招3年以上自动驾驶

1.负责理想汽车自动驾驶端到端模型方法研发和工程落地,包活动静态感知/通用障碍物/障碍物预测决策等端到端模型; 2.开发高效离线训练框架,以及可实时运行的在线推理框架,优化模型推理性能,研发模型部署工具链和优化工具; 3.建立云端数据感知/决策联合标注Pipeline、数据挖掘机制以及难样本分析等工具链,利用影子模型挖掘众包数据,通过数据闭环持续选代模型能力。

北京
logo of kuaishou
社招5-10年D13918

1、参与电商多模态大模型(MLLMs)的持续预训练和指令微调(SFT),开发精准的商品图谱、用户意图理解、跨模态检索等核心能力,赋能搜索、推荐等业务; 2、负责多模态生成算法(如Diffusion Models, VAEs等)的研发与创新,致力于解决生成内容的质量、多样性、可控性、可编辑性及采样效率等前沿问题; 3、基于大模型构建文本/图像/视频多模态创作引擎,并推动其在电商业务场景的产品化落地,包括但不限于背景替换、虚拟试衣、图生视频、海报生成等创新应用; 4、通过DPO/PPO等强化学习算法,迭代Reward Model以指导多模态素材生成,引导模型生成更符合人类偏好、审美标准及业务目标的多模态内容,最终提升用户体验和商品转化率。

更新于 2025-08-12北京
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 岗位介绍: 我们正在寻找一位才华横溢的生成式AI/世界模型算法工程师加入我们的团队,共同探索人工智能的前沿领域,构建下一代智能系统的核心技术。如果你对生成式AI/世界模型有深入的理解和研究,渴望在这一领域大展身手,那么请加入我们! 主要职责: 1. 3D静态生成:负责3D物体/场景生成算法的优化,探索高效的3D生成表示方式,并改进扩散或自回归生成模型,提升单图到3D物体或场景生成的精度与稳定性; 2. 3D动态生成:基于扩散/自回归视频生成基模,并引入3D场景表征和隐式动作表征,实现长视界一致、并且可交互的动态视频生成; 3. 世界模型构建:参与世界模型的前沿技术探索,包括环境建模、状态预测、决策规划等方面,以构建能够准确模拟和理解复杂环境的智能模型。探索空间智能的统一建模范式,包括未来状态预测以及未来动作预测,并构建反馈机制,最终实现自主学习; 4. 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。

更新于 2025-12-24北京
logo of amap
社招2年以上技术类-算法

我们是高德视觉技术中心,驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。我们团队致力于利用三维重建、生成式世界模型、多模态大模型等技术打通虚拟与现实,探索空间智能技术路线,让算法在真实应用中产生即时经济价值与社会影响力。 团队gihub主页:https://github.com/amap-cvlab 岗位职责: 1. 3D动/静态生产:利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D、长时序视频; 2. 世界模型构建:结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座; 3. 产线落地与性能优化:与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路; 4. 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。

更新于 2025-11-27北京