logo of kuaishou

快手音频开发工程师-【音频中心】

社招全职3-5年D2861地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机科学、电子工程、信号处理或相关专业优先;
2、具备扎实的编程能力,熟练掌握至少一种编程语言,如JavaC++等,熟悉RPC服务部署,有工程服务应用的实际项目经验;
3、具备良好的沟通能力和团队合作精神,能够深入理解和分析业务需求,并将算法应用到实际业务场景中;
4、具备良好的线上bug、性能问题的分析能力,能够高效定位和解决问题;
5、熟悉常用音频算法开源库/工具,如Whisper、HuBert、Encodec、Soundstream等,对语音算法有一定的了解。

工作职责


1、负责音频算法的服务端工程化落地,构建和优化工程pipeline,包括但不限于TTS、ASR,音频理解和生成等;
2、负责音频算法在语音交互、审核风控、内容生产等多个业务场景的落地;
3、负责系统性能分析和优化,保障算法响应时间和稳定性;
4、参与线上问题的定位和分析,配合算法侧持续优化算法效果和性能。
包括英文材料
学历+
Java+
C+++
RPC+
算法+
相关职位

logo of oppo
校招软件类

方向一:打造多端分布式多媒体框架,归一化媒体流转平台,提供流畅高效媒体流转体验; 方向二:支撑COLOR OS相册主线相关业务,为用户提供个性化、智能化的媒体创作体验 方向三:提升视效整体表现力,形成符合用户需求的真实视效风格 方向四:搭建端侧智慧语音技术平台,提供以手机为中心音频全场景解决方案 方向五:负责相机效果调优:以提升整体相机影像品质为目标,负责相机影像品质调适专案,将3A(Auto Focus, Auto White Balance, Auto Exposure)和ISP(Image signal processing)、曝光、色彩、噪点、清晰度等进行优化,将与晶片厂的团队共同合作,达到发挥镜头、感光元件及影像处理器最大效能; 方向六:负责相机相关的算法优化:运用光学影像原理,维护并提升现有的影像演算法; 方向七:负责Android系统多媒体音视频系统开发与优化:如视频解析解码&流媒体延迟画质问题、音频新方案开发设计与产品化落地; 方向八:负责Android平台显示系统包括SurfaceFlinger/HWC/DRM/input相关模块开发和维护、显示系统性能稳定性类问题、GPU绘制相关问题分析与解决; 方向九:Web多媒体相关开发优化,轻量级Web引擎开发、混合应用框架开发。

更新于 2025-07-14
logo of tesla
校招产品研发创新中心

负责车机端语音处理架构的设计、开发、优化,为数百万车主打造极致的语音交互体验。

更新于 2025-09-09
logo of kuaishou
社招5-10年D7244

1. 基于大模型的多模态内容理解技术研发与应用落地,涵盖文本、图像、音频、视频等多类型数据的融合处理; 2. 设计并优化多模态语义理解算法,包括但不限于跨模态检索、多模态内容生成、多模态情感分析、多模态语义匹配等; 3. 参与构建多模态内容理解系统,解决实际业务场景中的复杂问题,并应用于内容安全、生态治理、智能内容审核等核心业务中; 4. 跟踪国内外大模型与多模态技术前沿动态,将先进算法与技术转化为实际应用方案,推动技术创新与产品迭代。

更新于 2025-07-30
logo of tesla
社招质量部门

主要负责电气系统现场质量,跟踪电气系统的质保表现,发现电气量提升的机会;进行根本原因分析,识别现场故障的趋势和模式,推动问题分析和改进。 工作职责: •负责电气系统现场质量,快速响应客户投诉,跟踪问题解决,提高客户满意度; •跟踪电气系统的质保表现,发现电器质量提升的机会,确保出色的现场质量表现; •与工程团队协调,与组件所有者进行进一步的根本原因分析,识别现场故障的趋势和模式,并•与开发团队合作,推动短期修复和未来改进; •快速反应所有质保问题,分发给各职能部门并跟踪进度; •推动问题分析和改进,跟进并验证现场对策的有效性; •与服务团队合作,确保工厂内所有客户投诉的解决和问题的改善; •支持服务中心或现场调查问题,充分了解客户投诉,并根据客户反馈改善质量。 遵守公司规章制度,严格按照作业指导书工作,积极查找安全隐患,及时汇报安全隐患和事故,提出安全合理化建议,通过不断改进,创造安全健康的工作环境。