logo of sensetime

商汤26届AI领航员-研究院-算法研究员(实时视频生成)

校招全职算法研究地点:北京 | 上海 | 深圳状态:招聘

任职要求


1.	具有图像生成或视频生成的实际项目经验或顶会论文,熟悉FLUX, CogVideoX, Hunyuan, Wan等任一模型;
2.	具有扩散模型蒸馏方面的实际项目经验或顶会论文,熟悉LCM, LADD, DMD, APT等任一模型;
3.	对自回归和扩散模型均有一定了解,熟悉多模态理解模型(如Qwen2.5VL-7B)或图像生成模型(如FLUX)或视频生成模型(如Wan);
4.	熟悉语音、肢体等方式驱动的图像或视频生成方案;
5.	扎实的编程和数学知识,快速学习的能力。

工作职责


1.	实时视频生成算法研究: 紧密追踪并深入研究实时视频生成领域的最新进展,积极探索新的模型架构、训练范式、优化策略和硬件加速方案,实现并验证工业界可落地的方案;
2.	模型设计与优化: 负责实时视频生成模型的设计、训练、评估和优化,在保证视频质量的同时,大幅提升生成速度和计算效率;
3.	性能瓶颈分析与解决: 针对实时性要求,深入分析现有算法和系统的性能瓶颈,并提出有效的解决方案,确保视频生成流程的流畅与高效。
包括英文材料
相关职位

logo of sensetime
校招算法研究

1. 多模态空间智能前沿研究: 紧跟领域前沿,深入研究提升多模态模型在空间智能领域的整体性能; 2. 下游任务验证:验证多模态空间智能模型在具身智能体中的作用; 3. 创新技术探索: 探索新的预训练和后训练范式,找到在空间智能领域可泛化的训练范。

更新于 2025-07-28
logo of sensetime
校招算法研究类

1. 多模态理解与生成算法研究: 紧跟领域前沿,深入研究多模态(图像、文本、视频)的理解与生成统一的核心算法; 2. 模型设计与优化: 负责多模态理解与生成模型的设计、训练、评估和优化,不断提升模型性能和泛化能力; 3. 创新技术探索: 探索新的预训练和后训练范式,发现和解决大模型靠单一模态难以解决的问题。

更新于 2025-07-28
logo of sensetime
校招算法研究

1. 负责研究并实现创新算法以解决大模型挑战问题,支持AI代码助手、AI办公、拟人角色扮演等大模型课题; 2. 强化学习算法探索:挑战人类能力。探索模型的语义理解与AI生成能力的极限,进行超大模型训练算法设计; 3. 从系统应用的角度,利用大模型的理论和方法来解决实际业务问题。

更新于 2025-08-13
logo of sensetime
校招算法研究

1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。

更新于 2025-07-28