logo of tongyi

通义语音多模态研发工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学或相关专业硕士及以上学历,具有扎实的计算机、机器学习等理论基础。
2. 具备良好的编程能力和代码风格,有分布式系统、模型推理、AI Infra开发经验者优先。
3. 较强的分析和解决问题能力,并具备良好的沟通能力和团队合作精神,喜欢钻研并反思总结。

加分项:
1. 有互联网公司实习,分布式系统、模型工程、语音/多模态模型等相关研发工作或项目落地经验。
2. 在ACM等知名编程竞赛有获奖经历。
3. 有相关领域高水平论文或专利发表。

工作职责


团队围绕语音多模态模型,基于高性能分布式和云原生相关技术,建设模型推理和服务基础平台。如果你也对AGI有浓厚兴趣,有志于参与语音多模态技术体系的研发,欢迎加入我们团队,共同以技术手段让大模型变得更加普惠。
具体职责包括但不限于:
1. 参与语音和多模态大模型推理框架以及定制微调技术的研发与优化,做到极致性能和成本,探索多模态理解、生成和交互领域的前沿技术研究与创新。
2. 建设支持高并发访问的弹性平台服务后端,实现模型与云上计算资源间的互动,推动大模型在实际业务中的落地与应用。
3. 参与世界级规模的分布式服务端程序的系统设计,为阿里巴巴的产品提供强有力的后台支持,在海量的网络访问和数据处理中,设计并设施最强大的解决方案。
4. 参与跨部门,跨公司协作,探索多模态领域前沿技术研究与创新,推动包括语音在内的各领域最前沿模型的实际应用和落地。
5. 参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作。
6. 与团队成员紧密合作,推动项目进展,交付高质量的技术解决方案。
包括英文材料
学历+
机器学习+
分布式系统+
相关职位

logo of baidu
社招TPG

-负责语音大模型算法的设计与实现,开展国际领先的前沿算法探索 -负责语音大模型算法模型训练数据飞轮建设 -负责语音交互相关的多模态算法研发 -负责语音大模型下游算法研发

更新于 2024-03-01
logo of tencent
社招2年以上微信读书技术

1.负责多模态内容理解、多模态生成等算法技术在视频剪辑、多模态理解和生成业务上的落地工作:; 2.参与图像、视频、语音等多模态内容理解及生成相关算法的工程化落地; 3.参与多模态业务核心功能设计、开发及维护,包括但不限于服务性能调优、技术难点攻坚、指标自动化监控、异构大模型调度等; 4.参与维护后台服务,保证线上稳定性,以及搭建自动化分析系统,提升工程效率; 5.参与新技术调研以及探索,以及项目特定方向的重点、难点开发工作。

更新于 2025-09-15
logo of jd
社招软件开发岗

1.设计实现AIGC内容的安全审核系统,覆盖文本、图像、语音等多模态内容风险识别场景; 2.参与系统需求分析拆解,明确系统功能和性能要求,编写系统设计文档; 3.编码实现系统各项功能,并进行单元测试,配合测试团队进行系统测试,修复测试中发现的问题; 4.系统的上线部署维护,解决系统故障和安全问题,并负责系统升级和迭代; 5.持续优化系统的性能和稳定性,确保系统能够处理高并发交易并提供良好的用户体验; 6.探索研究新技术应用和创新技术解决方案,提升用户体验、提高交付效率、降低运营成本。

更新于 2025-06-30
logo of jd
社招软件开发岗

1.设计实现AIGC内容的安全审核系统,覆盖文本、图像、语音等多模态内容风险识别场景; 2.参与系统需求分析拆解,明确系统功能和性能要求,编写系统设计文档; 3.编码实现系统各项功能,并进行单元测试,配合测试团队进行系统测试,修复测试中发现的问题; 4.系统的上线部署维护,解决系统故障和安全问题,并负责系统升级和迭代; 5.持续优化系统的性能和稳定性,确保系统能够处理高并发交易并提供良好的用户体验; 6.探索研究新技术应用和创新技术解决方案,提升用户体验、提高交付效率、降低运营成本。

更新于 2025-06-30