logo of tongyi

通义视觉多模态(理解)大模型算法工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 来自全球Top高校计算机科学、人工智能、计算机视觉、具身智能、机器学习深度学习或相关领域应届毕业生,博士/硕士毕业生优先。
2. 在多模态模型(尤其是视觉语言模型)方面有扎实的理论基础和实践经验,熟悉图像、视频、3D、文本等至少两种模态的建模方法。
3. 在国际顶级计算机会议/期刊(如CVPRECCV、ICCV、NeurIPS、ICML、ICLR、ACL、TPAMI等)以一作身份发表论文,或在开源社区、计算机领域竞赛中有突出研究成果和项目经历。
4. 具备扎实的代码功底,熟悉PyTorch/Tens…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。

若你对以下一个或者多个方向感兴趣均欢迎投递:
1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing 等核心能力,并同时优化多模态大模型的AI infra。
2)通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体,将相关能力拓展到GUI agent,VLA,以及具身智能场景中。
3)研究理解与生成统一的模型架构,实现跨模态生成与推理的协同优化。

工作职责:
1. 多模态 pre-training:开展研究及进行实验,研究内容包括:数据清洗筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law 预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。
2. 多模态 post-training:迭代 post-training 训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。
3. 多模态推理和通用 agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的 test scaling laws,并推动模型对网络和虚拟世界的交互和任务完成能力。
4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。
包括英文材料
OpenCV+
机器学习+
Python+
PyTorch+
深度学习+
Transformer+
CVPR+
ECCV+
还有更多 •••
相关职位

logo of xiaohongshu
社招后端开发

【职位描述】 1、设计和实现机器学习平台业务系统, 包括工具链/组件等AI基础设施, 落地业务功能需求; 2、高效优化和部署 计算机视觉、语音识别、语音合成、自然语言处理 等业务模型; 3、与公司各算法部门深度合作, 分析业务性能瓶颈和系统架构特征, 软硬件结合优化, 实现极致性能。

北京|上海
logo of aliyun
社招5年以上技术类-前端

1、负责小天基/神农控制台/ASO/staragent/统一运维平台的前端开发工作,完成产品的前端框架升级,保证流畅的交互体验。 2、结合阿里云整体的视觉设计风格,建设统一的前端基础组件库(组件库、图形库、工程体系、低代码、服务化平台等),保障前端性能及交互一致性的同时,提升研发效率 3、基于阿里云统一的AEM基础设施对用户行为进行记录并建立数据化度量体系,为产品交互及后端性能优化方案或技术选型提供数据支撑 4、负责线上系统的维护和管理,保障系统稳定运行;

更新于 2025-04-02杭州
logo of aliyun
社招5年以上技术类-前端

1、负责小天基/神农控制台/ASO/staragent/统一运维平台的前端开发工作,完成产品的前端框架升级,保证流畅的交互体验。 2、结合阿里云整体的视觉设计风格,建设统一的前端基础组件库(组件库、图形库、工程体系、低代码、服务化平台等),保障前端性能及交互一致性的同时,提升研发效率 3、基于阿里云统一的AEM基础设施对用户行为进行记录并建立数据化度量体系,为产品交互及后端性能优化方案或技术选型提供数据支撑 4、负责线上系统的维护和管理,保障系统稳定运行;

更新于 2025-04-02北京
logo of amap
社招5年以上技术类-开发

● 负责高德大云图业务中心-二三维时空底座的算法工程化相关研发工作,实现算法落地、提升业务效率; ● 负责设计及开发在线服务系统,对外输出二三维时空底座能力; ● 负责设计及开发算力调度系统,实现大规模集群算力调度、分配及管理,提升资源利用率、提升系统吞吐能力; ● 负责搭建和运维算力平台,实现平台各节点的监控及自动运维能力,提升平台的稳定性以及可靠性; ● 为团队引入创新的技术、解决方案,解决当前难题,不断优化系统与架构;

更新于 2025-11-25北京