钉钉钉钉-AI(音频)-开发工程师
任职要求
1、计算机、软件工程、人工智能等相关专业本科及以上学历,3年以上后端开发或 AI 工程化经验。 2、精通 Python 和 C++ 编程,具有扎实的算法与数据结构基础,熟悉多线程/多进程编程及异步 I/O(Asyncio)。 3、熟悉 PyTorch 生态,熟练掌握 ONNX / TensorRT / OpenVINO 等模型导出及推理加速工具库。 4、熟悉主流音频模型架构(如 Whisper, Paraformer, VITS, CosyVoice, ChatTTS 等)。 5、熟悉音频处理基…
工作职责
1、模型部署与服务化封装:负责音频相关 AI 模型(ASR、TTS、Audio LLM 等)的工程化落地。将训练好的模型(涵盖小参数模型及复杂的音频处理 Pipeline)封装为高可用、高性能的线上服务(gRPC/RESTful API)。 2、高性能推理优化:负责构建支持高并发、低延迟的推理引擎。参考 vLLM、TGI 等主流 LLM 推理框架的优化思路(如 PagedAttention、Continuous Batching 等),针对音频模型的特性进行算子融合、显存优化和吞吐量提升。 3、实时流式处理:设计并实现 ASR(语音转文字)和 TTS(语音合成)的实时流式(Streaming)推理架构,优化首字延迟(TTFT)和端到端响应速度,确保在实时交互场景下的流畅体验。 4、系统稳定性与运维:负责推理服务的容器化(Docker/K8s)部署,配合 DevOps 建立服务的监控、日志追踪及自动扩缩容机制,保障线上服务的稳定性。
1、负责酷狗音乐主 APP 及衍生产品的 iOS 端迭代开发,涵盖音频播放、个性化推荐等核心模块; 2、主导 iOS 端架构设计,攻坚启动速度、内存占用、音频流畅度等性能瓶颈,使用 Instruments 等工具实现全链路优化; 3、解决音视频编解码、流媒体传输等重难点问题,探索 Kukily等 跨平台、音频 AI 等前沿技术在业务中的落地; 4、参与技术方案评审与代码审查,制定开发规范,沉淀音频开发、性能优化等技术方案;
26届春招可投城市:成都、西安 方向一:多媒体软件 1.负责手机影像/音频/屏显功能开发和软件架构优化,实现硬件、芯片和算法联动; 2. 相机功能的开发,如美颜、夜景、人像、防抖等,以及对应功能的性能、功耗和稳定性优化;音频功能开发,如Codec,外放,耳机等、以及音频模块的性能、功耗和效果的优化;显示功能的开发,如新形态折叠屏开发、可变帧率屏幕开发、显示后处理增强算法开发等,以及对应功能的性能、功耗和稳定性优化; 方向二:影像效果 1.负责Camera相关的算法优化:运用光学影像原理,维护并提升现有的影像演算法; 2.负责Camera 效果调优:以提升整体相机影像品质为目标,负责相机影像品质调适专案,将3A(Auto Focus, Auto White Balance, Auto Exposure)和ISP(Image signal processing)、曝光、色彩、噪点、清晰度等进行优化,将与晶片厂的团队共同合作,达到发挥镜头、感光元件,及影像处理器最大效能。 方向三:显示效果 1. 负责颜色视觉理论工程化,给用户提供舒适,健康,专业的屏幕色彩体验 2. 负责HDR,Dolby等视频图像的显示效果调优,对齐行业标准 3. 研究业内前沿技术,制定显示效果主客观的评价标准,参与屏幕定制和选型 4. 结合颜色理论和用户喜好,对效果算法进行优化 5. 负责屏显效果的新功能开发与维护; 方向四:影像系统 1.负责Camera功能开发与维护(虚化、多帧等);Camera第三方算法的移值和调试; 2.负责Android平台camera系统架构设计开发的相关问题分析。 3.负责相机App需求开发、性能优化、交互优化;
1.负责企业微信音频 AI 相关算法的研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、声纹识别、音色转换等方向; 2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化; 3.探索音频大模型在企业办公场景的创新应用,推动模型训练、微调及端侧部署落地; 4.跟进语音/音频领域前沿技术进展(Whisper、SpeechGPT 等),持续提升核心指标与用户体验; 5.与客户端、后台团队协作,完成算法从原型验证到工程化落地的全链路交付。
安克实习生项目是面向正式校招岗位的人才培养与选拔通道。实习期间将按照校招标准进行系统的培养与综合评估,表现优秀者可直接获得校招转正机会,提前锁定正式校招席位。我们以严肃、长期的视角对待每一位实习生,也期待与你共同成长。 【你将参与】 1. 协助参与公司耳机等智能硬件的客户端 App 功能开发、性能优化与日常维护,支持多平台(Android/iOS)兼容与用户体验提升; 2. 在导师指导下学习和实践 KMP(Kotlin Multiplatform) 与 CMP(Compose Multiplatform)跨平台开发模式,参与相关模块的设计与实现; 3. 参与 loT 设备连接与控制、AI 语音交互等核心功能的客户端开发与联调; 4. 配合硬件团队进行蓝牙协议通信、音频数据处理等功能开发与问题排查; 5. 尝试使用 AI工具辅助代码编写、测试用例生成与自动化验证,提升开发效率