logo of xpeng

小鹏汽车【26届校招】Research Scientist (Audio)

校招全职地点:深圳 | 上海 | 北京 | 香港状态:招聘

任职要求


1、计算机、电子工程、人工智能等相关领域硕士及以上学历;
2、在语音多模态方向具备扎实积累,熟悉多模态任务建模,跨模态模型设计与训练经验;
3、具有扎实的机器学习算法基础,在语音处理、自然语言处理等相关专业领域有研究经验,曾以第一作者身份在ACL/Interspeech/ICASSP/CVPR/CoRL/ICRA/NeurIPS/ICLR/ICML等顶会顶刊上发表过论文;
4、熟练使用PyTorch/TensorFlow等深度学习框架,具备良好的代码实现…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、面向机器人语音交互,打造行业领先的语音大模型,支撑真实世界中的自然、多轮、低时延、人机语音交互,并可在机器人/边缘设备高效部署。形成持续的技术影响力并引领国际行业发展。
包括英文材料
学历+
机器学习+
算法+
NLP+
CVPR+
NeurIPS+
还有更多 •••
相关职位

logo of xpeng
校招

1、构建行业领先的世界模型,为具身场景提供生成式仿真能力。强化世界模型的长程时空记忆,物理属性模拟能力,实现可泛化、可落地、可scaling的世界模型,形成持续的技术影响力并引领国际行业发展。

更新于 2025-08-21深圳|上海|北京
logo of xpeng
校招

1、面向通用人形机器人,打造行业领先的具身大模型,实现全身动作控制、场景及任务可泛化的、可scaling的VLA大模型研究,形成持续的技术影响力并引领国际行业发展。

更新于 2025-08-21深圳|上海|北京
logo of xpeng
校招

1、面向机器人真实场景,负责具身多模态大模型的工程化与规模化落地,包括大规模训练性能与效果优化,模型工程化与效果优化,端侧与异构部署加速,机器人系统集成。

更新于 2025-08-21深圳|上海|北京
logo of xpeng
校招

打造行业领先的原生具身智能大模型,如VLM/VLA/World Model/Omni。面向通用人形机器人及更广泛的具身场景,构建可泛化、可拓展、可scaling的大模型,负责大规模训练性能与效果优化。 职位要求: 1、计算机、电子工程、人工智能等相关领域硕士及以上学历; 2、具有扎实的机器学习算法基础,在VLM、LLM、AIGC、RL、Robotics、Audio 等相关专业领域有研究经验; 3、具有优秀的代码能力,精通PyTorch/TensorFlow等深度学习框架,熟悉大规模训练栈:大规模训练框架,加速方法; 4、具有良好的团队合作能力和沟通能力。

更新于 2025-10-30深圳|上海|北京