字节跳动智能音频算法工程师
社招全职A99152地点:深圳状态:招聘
任职要求
1、丰富的数字信号处理和人工智能/深度学习系统研发经验:在3D空间音频渲染,降噪/回声/去混响等音频前处理,声纹/唤醒,声音事件检测,语音识别,自然语言处理等一个或几个领域有项目实践; 2、熟悉数据结构和算法,深度网络模型设计和调优,熟练掌握Kaldi,Tens…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责字节跳动旗下音频内容消费业务场景的智能音频理解和处理算法研发和业务支持,业务包括但不限于抖音,西瓜视频,直播,剪映等; 2、搭建智能音频理解和处理的系统级解决方案,为字节跳动智能音频ToB提供技术火力; 3、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括3D空间渲染,音频质量提升系统,音频事件检测系统,音频理解系统等; 4、跟进产品业务的音频需求,持续改进产品的音频质量体验; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
还有更多 •••
相关职位
社招大模型
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL
北京|上海
社招0-3年XYZ
各类大模型算法岗位:包括不限于 ✓大模型应用(Rag、Agent的研究等) ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究(文本、图像、视频、音频等)
更新于 2025-02-18北京
社招3年以上CSIG技术
1.负责实时互动 AI 对话技术的研究与开发,推动算法在语音识别、增强、理解、合成等方向的落地与优化; 2.跟踪学术界及行业最新研究动态,并结合业务需求优化现有算法,提升系统性能和用户体验。
更新于 2025-04-17北京