logo of xpeng

小鹏汽车智能语音研发专家/资深工程师(小语种)

社招全职3年以上地点:慕尼黑状态:招聘

任职要求


1、计算机科学、统计学、人工智能或相关领域的硕士及以上学历;
2、精通英语,能够作为工作语言使用;掌握德语、法语等1-2种小语种,具备良好的听说读写能力;
3、至少掌握一种开发语言,具备深度学习算法/大模型 开发经验优先;
4、掌握语音识别/理解/合成等技术,参与过语音大模型相关工作或有语音大模型基础优先;
5、至少3年以上智能语音/对话系统领域工作经验,有海外项目经验者优先;
6、强烈的责任心和自我驱动力,能够在快节奏的工作环境中保持高效率;
7、出色的跨文化沟通能力和团队合作精神;
8、对新技术有强烈的好奇心和学习欲望,能够快速适应技术变化。

1.Master's degree or above in Computer Science, Statistics, Artificial Intelligence, or related fields.
2.Proficient in English, which can be used as a working language; mastery of one or two small languages such as German or French, with good listening, speaking, reading, and writing abilities.
3. Master at least one development language, and have deep learning algorithm/large model development experience is preferred.
4. Master speech recognition/understa…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责小鹏汽车海外市场的智能语音多语言能力建设,包括但不限于模型训练、调优和自测;
2、与国内团队紧密合作,确保语音识别和交互系统的准确性和流畅性,交付符合海外用户语音交互习惯的功能;
3、参与多语言大语言模型的研发和应用,跟踪最新的语音识别技术和对话系统发展趋势,将前沿技术应用到产品中,并通过用户反馈和数据分析,不断优化语音交互体验和智能化水平。
1. Responsible for the construction of multi-language capabilities for Xiaopeng Motors' intelligent voice in overseas markets, including but not limited to model training, tuning, and self-testing.
2. Work closely with domestic teams to ensure the accuracy and fluency of voice recognition and interaction systems, delivering features that meet the voice interaction habits of overseas users.
3. Participate in the research and development and application of multi-language large language models, track the latest trends in voice recognition technology and dialogue system development, apply cutting-edge technologies to products, and continuously optimize voice interaction experience and intelligence level through user feedback and data analysis.
包括英文材料
学历+
深度学习+
还有更多 •••
相关职位

logo of xpeng
社招3年以上

1. 负责小鹏汽车海外市场的智能语音多语言能力建设,包括但不限于NLU模型训练、调优和自测。 2. 与国内团队紧密合作,确保语音交互系统的准确性和流畅性,交付符合海外用户语音交互习惯的功能。 3. 参与多语言大语言模型的研发和应用,跟踪最新的大模型技术和对话系统发展趋势,将前沿技术应用到产品中,并通过用户反馈和数据分析,不断优化语音交互体验和智能化水平。

更新于 2025-01-03慕尼黑
logo of xpeng
社招3年以上

1、负责小鹏汽车海外市场的智能语音多语言能力建设,包括但不限于NLU模型训练、调优和自测,LLM领域/业务增强、多轮对话、智能Agent、数据生成等技术方向。 2、确保语音交互系统的准确性和流畅性,与海外团队紧密合作,交付符合海外用户语音交互习惯的功能。 3、参与多语言大语言模型的研发和应用,跟踪最新的大模型技术和对话系统发展趋势,将前沿技术应用到产品中,并通过用户反馈和数据分析,不断优化语音交互体验和智能化水平。

更新于 2025-01-03北京
logo of bytedance
社招A246507

1、负责公司音乐业务相关的音质音效开发与调优工作,相关研发技术在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中用户不断增长的高阶听感的需求; 2、负责音乐产品(如流媒体平台、智能硬件、音乐制作工具等)的音频效果设计、调试与优化,包括EQ均衡、动态处理、空间混响等参数调整; 3、针对不同场景(如耳机/音箱播放、直播、车载环境)定制音效方案,确保听觉体验一致性与适应性; 4、与算法工程师合作,将音效参数转化为可落地的DSP(数字信号处理)代码或硬件调音方案; 5、研究用户听音习惯及行业趋势(如空间音频、AI生成音乐),提出创新音效功能设计(如自适应环境降噪、个性化声场调节); 6、通过A/B测试、用户反馈数据分析,持续迭代音效参数库与预设模板。

更新于 2025-03-17北京
logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2025-11-20北京|杭州