字节跳动大模型推理优化工程师-Data语音
任职要求
1、扎实的C++或C编程语言,熟悉常用数据结构以及基础算法,对有挑战的工作富有热情; 2、熟悉计算机体系结构和操作系统,具备软件/库架构的设计与研发经验的更佳; 3、有较强的分析问题和解决问题的能力,有强烈的责任心。 加分项: 1、在ACM/NOI/IOI/Topcoder获奖者优先; 2、有定点量化、指令集优化、深度模型优化等相关项目经验者优先; 3、有CPU、GPU、NPU、ARM、OpenCL、DSP等高性能计算优化经验者优先; 4、有相关语音信号处理,语音识别、语音合成或者自然语言处理经验的优先; 5、有相关语音算法引擎开发经验的优先。
工作职责
1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。
1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。
1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。
团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、负责大模型推理框架与引擎建设,提供满足音频各场景的核心原子能力; 2、负责大模型推理框架与引擎深度优化,包括语音信号处理、交互、翻译、理解、生成、音乐等大模型推理性能极致优化,支持相关大模型业务落地; 3、负责语音大模型模型压缩(如蒸馏、量化、投机采样等)技术业务迭代与落地; 4、负责为字节跳动全系产品(豆包、抖音、剪映、番茄小说、飞书、火山引擎等)提供AI语音理解、对话以及合成等方面的能力,用AI技术影响数亿国内国际用户。