logo of tongyi

通义通义实验室-模型训练/推理优化算法专家-通义万相

社招全职3年以上地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习能等领域的博士/硕士毕业生,掌握机器学习深度学习基础知识,熟悉常用视觉生成算法,熟悉PytorchTensorflow等至少一种深度学习框架。
2. 极佳的工程实现能力,熟练掌握C/C++JavaPython等至少一门语言 ,ACM/ICPC、topcoder等编程比赛获奖者优先。
3. 良好的科研能力,有成果发表在CVPRICCVNeurIPSICLRTPAMI等国际顶级会议、期刊者优先。
4. 对生成方向具有技术热情、良好的技术洞察力和优秀的业务分析能力,能应对复杂的业务算法需求。
5. 关注技术影响力,具有开源开放精神,对基础模型的前沿问题有持续热情,有追求,渴望做出有极大影响力的工作。
6. 具备跨学科视野与协作意识,能够与工程、产品等多学科团队紧密合作,推动研究成果快速落地并产生实际影响。

工作职责


【部门介绍】
随着大模型技术的飞速发展,理解和生成多模态数据(图像、视频、音频、3D素材等)的能力日益增强。目前,构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点,也是实现通用人工智能(AGI)的重要技术路径之一。
通义万相(Wan)将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索,始终追求在多模态世界模型领域的领先研究地位,致力于建立世界级的技术影响力。

【职位描述】
1. 负责通义万相多模态生成大模型研发,重点解决生成大模型的训练和推理效率问题。
2. 负责研发各种蒸馏加速算法,包括CFG蒸馏,推理步数蒸馏等。
3. 负责研发各种Training-free推理加速算法,不限于cache、量化、采样优化等策略。
4. 负责研发生成模型的高效训练架构,包括但不限于sparse/linear attention、时空独立建模、超分模块等策略。
包括英文材料
机器学习+
深度学习+
算法+
PyTorch+
TensorFlow+
C+
C+++
Java+
Python+
CVPR+
ICCV+
NeurIPS+
ICPC+
TPAMI+
相关职位

logo of tongyi
社招3年以上技术类-算法

1.参与前沿语音生成大模型的研发,涵盖数据体系设计、模型架构设计、训练优化等。 2.探索语音合成、声学建模、自然语言处理等多模态融合技术,提升模型在语音质量、自然度及逻辑推理能力上的表现。 3.针对实际应用场景(音色克隆、情感控制等)优化模型效果和性能,解决复杂技术难题。

更新于 2025-09-25
logo of aliyun
社招5年以上云智能集团

1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升

更新于 2025-08-14
logo of tongyi
社招3年以上技术类-开发

通义实验室语音工程团队主要负责通义系列模型在语音及其他更广泛的多模态交互、理解场景下的优化、落地和应用。我们在阿里云上提供业界领先、开箱即用的模型服务API,支持全世界的开发者,以及阿里集团内如钉钉、淘天、夸克等30+业务线。我们同时也在和算法科学家们共同探索最前沿模型的能力边界,构建以多模态大模型为核心的新产品,向外展示通义的技术先进性和影响力。 1. 探索多模态理解与生成大模型的技术边界,支持多模态模型的功能迭代和推理性能优化。 2. 构建极致性能的实时流式输入/输出系统,提供百毫秒级别的端到端延迟体验。 3. 建设超低延迟、高可用、可扩展的分布式模型服务系统,通过提升模型吞吐和并发,提供最普惠的AI模型服务。 4. 分析和解决复杂的软硬件技术问题,跟踪行业最新的多模态大模型和应用开发工具和技术,将最佳实践和创新集成到平台中。

更新于 2025-09-25
logo of aliyun
社招3年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。

更新于 2025-10-18