logo of aligenie

智能互联通义实验室-多模态后训练算法专家-杭州/上海/北京

社招全职1年以上技术类-算法地点:北京 | 杭州 | 上海状态:招聘

任职要求


1、计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。
2、在多模态、计算机视觉NLPAIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究。
3、有多模态大模型后训练相关经验,benchmark构造经验。
4、能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。
加分项:
1、具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、探索研究多模态理解、视频理解等方向的前沿技术。
2、关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力。
包括英文材料
机器学习+
学历+
OpenCV+
NLP+
AIGC+
大模型+
算法+
CVPR+
还有更多 •••
相关职位

logo of tongyi
社招1年以上技术类-算法

1、探索研究多模态理解、视频理解等方向的前沿技术。 2、关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力。

更新于 2026-04-08北京|杭州|上海
logo of tongyi
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-03-31北京|杭州
logo of tongyi
社招5年以上技术类-算法

1. 负责面向AI手机等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。

更新于 2026-04-03北京|上海|杭州
logo of aligenie
社招5年以上技术类-算法

1. 负责面向AI手机等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。

更新于 2026-04-03北京|杭州