通义通义实验室-算法专家-通义灵码&AI Coding

社招全职3年以上技术类-算法2025-10-29地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 人工智能（AI）/软件工程（SE）相关方向的硕士及以上学历，有扎实基础和丰富经验。
2. 曾负责或作为核心同学参与过大模型/代码大模型的训练（预训练、后训练）。
3. 曾负责或作为核心同学…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

大模型开启了崭新的智能化时代，代码智能化将是智能化革命的核心力量。围绕AI Coding，从code model到coding copilot再到coding agent，我们进行了深入的技术建设，打造了国内最受欢迎的智能编码助手通义灵码，并不断探索新的产品形态，欢迎一起来做改变世界的代码智能技术，具体详见：https://tongyi.aliyun.com/lingma

职位描述：
1. 负责软件工程大模型（Agentic LLM for Software Engineering）的训练和研究等，包括但不限于Agentic RL、Reward Systems、Environment Scaling等。
2. 打造自主编码智能体的核心技术，包括但不限于Memory、Context Engineering、Tools-use、Reasoning等。
3. 将上述技术在通义灵码及其他创新产品中进行大规模应用落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

相关职位

通义实验室-语音识别/语音大模型算法专家-通义百聆

社招3年以上技术类-算法

团队介绍：我们是阿里巴巴通义实验室语音团队，在音频AI领域持续推动技术创新与产业落地。我们的成果包括： 1. ModelScope平台语音/音频板块核心算法团队 2. FunASR、CosyVoice、3D-Speaker等开源社区发起者与核心维护团队 3. 通义听悟（tingwu.aliyun.com）音频及语义算法团队 4. 阿里云智能语音交互及灵积语音模型服务核心算法提供方岗位职责： 1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。 2. 音频理解方向：（1）研发语音识别、语音翻译以及音频分析等理解算法。（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。（3）探索音频大模型架构设计。（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

更新于 2025-11-23北京|杭州

通义实验室-VLA算法专家-通义千问

社招3年以上技术类-算法

通义千问（Qwen）是由通义实验室自主研发的超大规模语言模型，具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从亿级到万亿级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。在此基础上，我们致力于研究Qwen面向具身智能领域的下一代基础模型，将Qwen强大的认知与推理能力赋予物理世界的机器人智能体，打破数字世界与物理世界的壁垒。团队的目标是研发能够理解人类意图、感知物理环境、并自主规划执行复杂任务的通用具身基础模型。我们相信，通过融合前沿的多模态大模型与机器人技术，我们将开创通用人工智能的下一个篇章，让AI真正走进并服务于现实生活。工作职责： 1. 具身基础模型研究：构建面向机器人的多模态基础模型，将视觉语言模型与机器人中心的物理世界理解与决策深度融合，构建具身领域的高质量的大规模真实与仿真数据集，设计并训练支持感知、动作、记忆、规划与语言理解统一的具身基础模型。 2. 测评基准建立：构建面向机器人多模态基础模型的能力基准，设计有效的测试基准，持续构建能反映基础模型在物理世界真实能力的高效测评系统。 3. 软硬件系统整合部署：构建机器人软硬件一体化系统，将算法部署在真实机器人平台（如机械臂、人形机器人）上，进行端到端的验证与迭代，推动研究成果的实际落地。

更新于 2025-10-31杭州

通义实验室-多模态交互算法专家-通义百聆

社招2年以上技术类-算法

1. 负责通义实验室多模态口语交互的算法研发，通过深入理解全链路多模态交互技术，推进大模型增强的语言交互技术能力建设。 2. 多模态交互：（1）端到端多模态联合建模 - 语音/视觉/文本等模态融合并应用于人机交互场景。（2）多模态交互应用算法 - 意图动态规划、多智能体协作、多任务推理、主动交互。（3）多模态对话系统设计 - 多轮交互状态管理、情境感知、情感理解及生成控制。 3. 音视频内容理解：（1）转写内容后处理 - 书面化、标点、分段分章节。（2）音视频分析 - 分角色、语种判别、视频场景划分。（3）口语内容长篇章理解及生成。 4. 探索多模态口语交互技术落地于实际应用场景，包括但不限于：（1）消费电子-智能穿戴实时交互、手机多模态助手、具身机器人环境感知。（2）内容消费-音视频媒资、会议场景、电销通话多模态理解等。 5. 持续关注行业前沿动态，通过专利申请、论文和技术报告等形式提升团队的技术影响力。

更新于 2025-11-07北京|杭州

通义实验室-语音处理算法专家-通义百聆

社招3年以上技术类-算法

1. 负责通义实验室语音团队的语音处理算法研发，通过深入理解全链路技术挑战和推动语音前后端协作，不限于语音增强、回声消除、麦克风阵列（波束形成、声源定位等）、语音唤醒、多模检测、轻量化ASR/TTS/LLM等任务，打造行业领先的语音处理算法。 2. 持续关注行业前沿动态，通过专利申请、论文和技术报告等形式提升团队的技术影响力。

更新于 2025-11-01北京|杭州