logo of tongyi

通义通义实验室-多模态理解算法专家-杭州/北京

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、计算机科学、人工智能、机器学习或相关领域的硕士或博士学位;
2、在多模态、计算机视觉NLPAIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究;
3、具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者;
4、能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。
加分项:
1、具有优秀的基础算法、扎实的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、探索研究多模态理解、计算机视觉、自然语言处理等前沿技术;
2、参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力;
3、负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
包括英文材料
机器学习+
学历+
OpenCV+
NLP+
AIGC+
大模型+
算法+
CVPR+
还有更多 •••
相关职位

logo of quark
社招1年以上技术类-算法

1. 探索研究多模态理解、计算机视觉、自然语言处理等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-08-19北京|杭州
logo of aligenie
社招3年以上技术类-算法

1、探索研究多模态理解、计算机视觉、自然语言处理等前沿技术; 2、参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力; 3、负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-04-03北京|杭州
logo of quark
社招2年以上技术类-算法

1. 负责音频多模态理解大模型的研发,包含语音识别、语音翻译、副语言理解、音频事件检测或音频captioning等任务的基础研究和应用落地; 2. 研究音频编码器、跨模态对齐、强化学习、多任务学习或语音端到端等技术方向; 3. 跟踪并落地领域内前沿论文,保持技术方案的领先性。

更新于 2026-04-02北京|杭州|上海
logo of aligenie
社招2年以上技术类-算法

1. 负责音频多模态理解大模型的研发,包含语音识别、语音翻译、副语言理解、音频事件检测或音频captioning等任务的基础研究和应用落地; 2. 研究音频编码器、跨模态对齐、强化学习、多任务学习或语音端到端等技术方向; 3. 跟踪并落地领域内前沿论文,保持技术方案的领先性。

更新于 2026-04-02北京|杭州|上海