字节跳动语音引擎研发工程师-Data语音

校招全职A1573602025-07-24地点：北京状态：招聘

扫码手机上打开

任职要求

1、2026届获得本科及以上学历，计算机等相关专业优先；
2、扎实的C++、C、Python编程语言，熟悉常用数据结构以及算法，对有挑战的工作富有热情；
3、熟悉计算机体系结构和操作系统，具备软件/库架构的设计与研发经验的更佳；
4、有较强的分析问题和解决问题的能力，有强烈的责任心。

加分项：
1、在ACM/NOI/IOI/TopCoder获奖者优先；
2、有量化、GP…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程，赋能内容创作和互动，并以中台形式支持集团多个业务，提供业界前沿的技术能力与解决方案。

1、负责大模型推理框架与引擎建设，提供满足音频各场景的核心原子能力；
2、负责大模型推理框架与引擎深度优化，包括语音信号处理、交互、翻译、理解、生成、音乐等大模型推理性能极致优化，支持相关大模型业务落地；
3、负责语音大模型模型压缩（如蒸馏、量化、投机采样等）技术业务迭代与落地；
4、负责为字节跳动全系产品（豆包、抖音、剪映、番茄小说、飞书、火山引擎等）提供AI语音理解、对话以及合成等方面的能力，用AI技术影响数亿国内国际用户。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+++

C+

Python+

数据结构+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

机器学习系统工程师 -AI技术部

社招后端开发

【职位描述】 1、设计和实现机器学习平台业务系统, 包括工具链/组件等AI基础设施, 落地业务功能需求； 2、高效优化和部署计算机视觉、语音识别、语音合成、自然语言处理等业务模型； 3、与公司各算法部门深度合作, 分析业务性能瓶颈和系统架构特征, 软硬件结合优化, 实现极致性能。

北京|上海

优酷-嵌入式软件开发技术专家-深圳

社招5年以上

1、嵌入式AI系统开发： • 负责RTOS系统平台上多模态AI终端产品的研发，包括方案评估、软件架构设计、核心功能模块（如人脸/手势识别、行为分析）开发与部署； • 主导端侧AI模型轻量化、跨平台推理框架适配（TensorFlow Lite/MNN/NCNN）及NPU芯片的性能优化（如内存、功耗、实时性）； • 结合硬件特性设计轻量化模型架构，完成从算法训练到嵌入式端侧部署的全链路开发。 2、多模态算法工程化： • 优化计算机视觉算法在嵌入式设备（IoT/AR硬件/AI机器人）的落地效果，解决低算力、高延迟、多干扰场景下的工程挑战； • 开发芯片算子库适配方案，参与芯片选型、AI工具链优化及端云协同架构设计； • 探索多模态交互（视觉+语音+传感器）在智能终端的创新应用，如AI玩偶、陪伴机器人等。 3、跨团队协作与交付： • 与芯片厂商、算法团队、硬件团队协同开发，主导端侧SDK集成及性能调优，确保产品按时交付； • 支持产品量产落地，保障系统稳定性与用户体验。

更新于 2025-04-02深圳

大语言模型应用算法工程师-豆包大模型

社招1年以上A247041

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用，研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案，满足用户不断增长的智能交互需求，全面提升用户在未来世界的生活和交流方式；主要工作方向包括： 1）优化&创新RLHF算法训练效率与模型泛化能力； 2）Long CoT技术的实现和应用； 3）多模态大模型（文本、图像、语音）的Posttraining算法； 4）构建高质量、多领域的数据合成方法； 5）探索LLM在情感对话、创作等场景的应用。

更新于 2025-02-18上海

多模态算法工程师-语音方向

社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处，我们真诚邀请对大模型 Omni Model 有热情的同学加入，共同打造更具影响力的智能系统。你会成为团队的一员，并和其他同事协作，共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展，不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。区别于传统 ASR / TTS 级联技术，我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平，彻底改变以 Chatbot 文字为主的人机交互界面岗位说明：你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作，包括但不限于如下事项海量的语音数据处理和构建：定性分析、定量评估数据质量，并给出 scalable 的改进方案；探索跨模态（文字/视觉/语音）混合训练的最佳实践；探索更加高效且合理的模型架构，让模型更加理解音频，同时让模型具备更好的语音合成能力研究并探索基于 Omni Model 的 Post Train，包含但不限于 SFT 和 RL

北京|上海