logo of antgroup

蚂蚁金服【医疗热招】蚂蚁集团-语音大模型算法-数字医疗

社招全职2年以上技术类-算法地点:上海 | 杭州 | 北京状态:招聘

任职要求


1、本科及以上学历,语音、多模态、机器学习、计算机相关专业,2年以上语音研发工作经验;
2、熟悉语音前端,唤醒,VAD,ASR,TTS,端到端、原生多模态等算法原理;
3、有语音交互项目的推进和落地经验,熟悉业界主流的语音系统实现方案;
4、具备扎实的工程落地,代码优化经验,熟悉python/C/C++语言,熟悉语音算法引擎的代码实现,有较丰富的语音系统工程优化经验;
5、有大模型开源项目、医疗应用场景实操经验者优先;有人工智能顶会论文发表者优先。

工作职责


1. 负责医疗语音大模型的研发和应用,包括语音前端DSP,3A,VAD,ASR,TTS等算法及原生多模态等新技术方案,推进语音新技术的突破;
2. 开发医疗领域领先的技术产品,如泛医疗助手、医护办事等产品,提升医疗行业场景的用户体验和效率,打造支付宝医疗健康新时代下的AI应用;
3. 研究和跟踪前沿技术发展,探索AI助力医疗普惠和智能化的新范式。
包括英文材料
学历+
机器学习+
算法+
Python+
C+
C+++
大模型+
相关职位

logo of antgroup
社招5年以上技术类-算法

1. 负责医疗多模态大模型的研发和应用,深入挖掘垂直医疗行业、开源以及蚂蚁的海量数据,研究前沿大模型训练和优化方法,结合医疗行业特性构建图文/语音/视频交互的医疗多模态大模型。 2. 开发医疗领域领先的技术产品,如报告解读、皮肤、影像识别等产品,提升医疗行业场景的用户体验和效率,打造支付宝医疗健康新时代下的AI应用。 3. 研究和跟踪前沿技术发展,探索AI助力医疗普惠和智能化的新范式。

更新于 2025-09-26
logo of antgroup
社招1年以上技术类-数据

1. 负责大模型(LLM)预训练阶段的数据处理工作,包括数据收集、清洗、去重、标注、格式转换及质量评估。 2. 针对多模态(文本、图像、语音等)或垂直领域数据,设计高效的数据处理流程与标准化方案。 3. 分析数据分布特征,识别并解决数据偏差、噪声等问题,确保训练数据的多样性和高质量。 4. 开发自动化数据处理工具与脚本,优化数据清洗、标注及质量评估的效率和规模化能力。 5. 与算法团队紧密协作,根据模型训练需求定制数据策略,提升预训练效果。 6. 跟踪学术界与工业界前沿数据处理技术,沉淀技术文档与最佳实践。

更新于 2025-06-06
logo of tencent
社招2年以上微信基础AI探索

1.研发具备通用能力的端到端语音大模型,包括多语种语音识别、语音合成、声纹识别、副语言信息理解等; 2.推动上述语音技术与团队内部大语言模型 (LLM) 的深度融合,参与设计和实现智能语音交互系统架构; 3.在微信AI探索业务中,基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2025-08-12
logo of quark
社招2年以上技术类-算法

1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地; 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果; 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。

更新于 2025-09-19