logo of tongyi

通义通义实验室-模型训练/推理优化算法专家-通义万相

社招全职3年以上地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习能等领域的博士/硕士毕业生,掌握机器学习深度学习基础知识,熟悉常用视觉生成算法,熟悉PytorchTensorflow等至少一种深度学习框架。
2. 极佳的工程实现能力,熟练掌握C/C++、Java、Python等至少一门语言 ,ACM/ICPC、topcoder等编程比赛获奖者优先。
3. 良好的科研能力,有成果发表在CVPR、ICCV…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【部门介绍】
随着大模型技术的飞速发展,理解和生成多模态数据(图像、视频、音频、3D素材等)的能力日益增强。目前,构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点,也是实现通用人工智能(AGI)的重要技术路径之一。
通义万相(Wan)将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索,始终追求在多模态世界模型领域的领先研究地位,致力于建立世界级的技术影响力。

【职位描述】
1. 负责通义万相多模态生成大模型研发,重点解决生成大模型的训练和推理效率问题。
2. 负责研发各种蒸馏加速算法,包括CFG蒸馏,推理步数蒸馏等。
3. 负责研发各种Training-free推理加速算法,不限于cache、量化、采样优化等策略。
4. 负责研发生成模型的高效训练架构,包括但不限于sparse/linear attention、时空独立建模、超分模块等策略。
包括英文材料
机器学习+
深度学习+
算法+
PyTorch+
TensorFlow+
C+
C+++
还有更多 •••
相关职位

logo of tongyi
社招1年以上技术类-算法

1、 主导/核心参与全模态大模型(文本、图像、视频、音频、3D等)的模型架构与核心算法设计、训练及优化,探索跨模态对齐、多模态融合和原生多模态等前沿技术创新; 2、 开发全模态大模型在具体场景中的应用落地(如实时AI视频通话等方向),将全模态大模型技术与业务需求结合,推动场景化落地; 3、 解决全模态大模型训练和推理的挑战性问题(如模态对齐、长序列建模、高效推理等),跟踪相关领域在学术界与工业界的最新进展等。

更新于 2025-11-10北京|杭州
logo of tongyi
社招5年以上技术类-算法

1. 负责面向AI手机、智能座舱等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。

更新于 2025-11-22北京|上海
logo of tongyi
社招3年以上技术类-算法

1.参与前沿语音生成大模型的研发,涵盖数据体系设计、模型架构设计、训练优化等。 2.探索语音合成、声学建模、自然语言处理等多模态融合技术,提升模型在语音质量、自然度及逻辑推理能力上的表现。 3.针对实际应用场景(音色克隆、情感控制等)优化模型效果和性能,解决复杂技术难题。

更新于 2025-12-03北京|杭州
logo of aliyun
社招5年以上云智能集团

1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升

更新于 2025-08-14北京|深圳|杭州