logo of tongyi

通义视觉多模态(生成)大模型算法工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、计算机视觉、人工智能、机器学习、具身智能等领域的博士/硕士毕业生。
2. 对通用视觉理解或生成模型有一定研究实践,在图像 / 视频 / 3D 等至少一种模态上有实际研发经验。
3. 熟练掌握Pytorch,熟悉Megatron大模型训练框架,有优秀的coding/工程能力。
4. 自我驱动力,动手能力强,工作细致,对AI行业有浓厚的兴趣,有较强的学习能力和责任心。
5. 善于平衡研究目标及落地实现,具备跨学科视野与协作意识,能够与工程、产品等多学科团队紧密合作,推…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。

团队致力于实现理解生成一体化的世界模型,达成“交互”和“创造”两大目标。本方向专注于研发视觉生成技术的突破,其中研究内容包括但不限于:理解生成一体化、视觉生成等,充分探索相关数据及训练方法研究,以期解决计算机视觉基本问题的同时,为 AI 赋予创造力,理解世界及预测未来世界。

工作描述:
1. 下一代理解生成一体化的模型结构设计与研发,探索 Autoregressive LLM 、Diffusion、及两者结合的多种技术路线。
2. 研究及探索世界模型的多模态训练数据及对应训练策略。
3. 设计及研发自动化评估方法设计与实现,为模型研发提供科学指导。
包括英文材料
OpenCV+
机器学习+
PyTorch+
Megatron+
大模型+
还有更多 •••
相关职位

logo of xiaohongshu
社招后端开发

【职位描述】 1、设计和实现机器学习平台业务系统, 包括工具链/组件等AI基础设施, 落地业务功能需求; 2、高效优化和部署 计算机视觉、语音识别、语音合成、自然语言处理 等业务模型; 3、与公司各算法部门深度合作, 分析业务性能瓶颈和系统架构特征, 软硬件结合优化, 实现极致性能。

北京|上海
logo of aliyun
社招5年以上技术类-前端

1、负责小天基/神农控制台/ASO/staragent/统一运维平台的前端开发工作,完成产品的前端框架升级,保证流畅的交互体验。 2、结合阿里云整体的视觉设计风格,建设统一的前端基础组件库(组件库、图形库、工程体系、低代码、服务化平台等),保障前端性能及交互一致性的同时,提升研发效率 3、基于阿里云统一的AEM基础设施对用户行为进行记录并建立数据化度量体系,为产品交互及后端性能优化方案或技术选型提供数据支撑 4、负责线上系统的维护和管理,保障系统稳定运行;

更新于 2025-04-02杭州
logo of aliyun
社招5年以上技术类-前端

1、负责小天基/神农控制台/ASO/staragent/统一运维平台的前端开发工作,完成产品的前端框架升级,保证流畅的交互体验。 2、结合阿里云整体的视觉设计风格,建设统一的前端基础组件库(组件库、图形库、工程体系、低代码、服务化平台等),保障前端性能及交互一致性的同时,提升研发效率 3、基于阿里云统一的AEM基础设施对用户行为进行记录并建立数据化度量体系,为产品交互及后端性能优化方案或技术选型提供数据支撑 4、负责线上系统的维护和管理,保障系统稳定运行;

更新于 2025-04-02北京
logo of amap
社招5年以上技术类-开发

● 负责高德大云图业务中心-二三维时空底座的算法工程化相关研发工作,实现算法落地、提升业务效率; ● 负责设计及开发在线服务系统,对外输出二三维时空底座能力; ● 负责设计及开发算力调度系统,实现大规模集群算力调度、分配及管理,提升资源利用率、提升系统吞吐能力; ● 负责搭建和运维算力平台,实现平台各节点的监控及自动运维能力,提升平台的稳定性以及可靠性; ● 为团队引入创新的技术、解决方案,解决当前难题,不断优化系统与架构;

更新于 2025-11-25北京