滴滴27届秋储-语音算法工程实习生(L lab)
实习兼职算法类地点:北京状态:招聘
任职要求
1、2027届在校生,硕士及以上学历,计算机相关专业优先 2、熟悉主流语音合成框架(如 CoSyVoice、F5、Bert-VITS、GPT-SoVITS 等),并具备实际调优经验 3、熟悉端到端语音大模型架构(如 MoShi、Llama-Onmi、GLM-Voice、Mimi-Omni 等),了解其训…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与基础大语言模型应用研发 2、结合机器学习、强化学习等技术优化基础大语言模型 3、调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。
包括英文材料
学历+
语音合成+
https://www.ibm.com/think/topics/text-to-speech
Text to speech (TTS) is a type of technology that converts text on a digital interface into natural-sounding audio.
BERT+
https://www.youtube.com/watch?v=xI0HHN5XKDo
Understand the BERT Transformer in and out.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
还有更多 •••
相关职位
实习工程-客户端类
1、协助负责公司端侧语音、视觉相关 Android 工程架构设计与核心模块开发,包括但不限于语音识别、语音合成、音视频预处理、端侧推理、相机 / 图像采集等能力建设 2、协助负责Android 平台性能优化:启动速度、内存、功耗、帧率、稳定性、包大小等专项优化,保障高并发、低时延场景下的端侧体验 3、协助负责 Android 音频 / 相机 / 传感器等系统底层能力调用、权限管理、兼容性适配,解决多机型、多系统版本的工程问题。
更新于 2026-05-29杭州
实习运营类
1、协助开展人工和智能服务相关的运营和优化改善工作,包括但不限于IVR,电话,在线,自助,机器人等服务渠道的体验提升 2、协助监控人工和智能服务整体流量,质量,效率等指标,在导师指导下进行基础的数据提取和排查,进行初步的维度拆解和归因分析 3、针对发现的问题,联合多方进行优化:包括但不限于IVR、语音、在线、智能受理之间的相互交互,智能服务渠道下用户场景逻辑的梳理和优化,单轮/多轮的交互设计,基于用户行为进行归类分析等。
更新于 2026-05-07北京|杭州
实习工程-系统类
1、面向公司研发部门的提供稳定、高效、易用的存储组件产品,负责架构和运维体系设计、研发工作 2、持续优化存储组件稳定性、性能、成本、可用性、可扩展性、可维护性等 3、深入理解业务场景和需求,发掘和思考技术演进方向,交付高质量结果。
更新于 2026-04-03北京