腾讯微信基础-语音大模型算法工程师
任职要求
1.硕士或博士学位,机器学习、人工智能、数字信号处理或相关领域的专业背景; 2.深入理解语音音频信号处理、声学建模、语言模型和大模型架构; 3.在语音合成、语音识别、声纹识别中至少一个领域有深入研究和扎实的实践经验;熟悉多个领域者优先; 4.有…
工作职责
1.研发具备通用能力的端到端语音大模型,包括多语种语音识别、语音合成、声纹识别、副语言信息理解等; 2.推动上述语音技术与团队内部大语言模型 (LLM) 的深度融合,参与设计和实现智能语音交互系统架构; 3.在微信AI探索业务中,基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。
1.负责企业微信音频 AI 相关算法的研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、声纹识别、音色转换等方向; 2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化; 3.探索音频大模型在企业办公场景的创新应用,推动模型训练、微调及端侧部署落地; 4.跟进语音/音频领域前沿技术进展(Whisper、SpeechGPT 等),持续提升核心指标与用户体验; 5.与客户端、后台团队协作,完成算法从原型验证到工程化落地的全链路交付。
【关于我们】 点点是小红书新一代生活场景AI搜索助手,依托DeepSeek大模型 + 小红书海量真实笔记 + 全网经验,为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,已形成独立App、微信小程序 + 小红书站内“问点点”全域布局。 “用增方向”(用户增长)是点点的核心战略引擎,当前重点通过外部流量平台投放(抖音、快手、B站、微博、小红书生态外渠道、搜索广告等)驱动新用户获取、激活与留存,实现DAU快速规模化增长。我们正在构建高效的投放增长闭环:从创意素材生成、投放策略优化、实时效果监控,到用户全链路转化漏斗优化,推动点点成为年轻人日常必备的“生活搜索神器”。 我们期待对内外部流量投放增长有深度实战、对AI产品冷启动与规模化增长敏感、对数据驱动决策有极致追求的资深后端同学,一起把点点从“有用”做到“让人上瘾、规模爆发”! 【岗位职责】 1、负责点点内外部流量投放增长系统的核心架构设计与开发,包括投放数据实时采集、策略引擎、预算分配、创意分发、A/B实验平台、转化归因链路等; 2、构建高并发、低延迟的投放决策与监控服务,支持日均亿级曝光、千万级点击的实时个性化投放与动态调优; 3、设计并实现跨平台投放统一中台,打通抖音、快手、B站、微博、搜索广告(百度/字节/腾讯系)等多渠道数据与投放接口,实现统一调度、预算智能分配、ROI实时优化; 4、建设增长实验平台与效果分析体系,支持快速测试投放创意、落地页、渠道策略、用户分层等,驱动新用户获取成本持续下降、激活/留存率显著提升; 5、与算法(推荐/召回/创意生成)、客户端、数据、运营团队深度协作,推动外部流量 → App/小程序激活 → 多轮交互 → 留存的闭环增长; 6、优化系统性能、稳定性与成本控制,支撑高峰期QPS与低延迟,确保投放链路99.99%可用性; 7、参与增长基础设施建设(如实时特征平台、埋点治理、归因模型、反作弊体系等),赋能投放增长效率翻倍。
1.研究AI模型推理加速技术在微信业务中的应用,参与TFCC服务平台和推理引擎的研发与优化,提升推荐模型、大模型、传统中小模型等业务场景的推理性能; 2.负责微信后台AI算法的工程应用与优化,支持语音识别、语音合成、视觉理解、大语言模型等业务的后台工程开发与优化; 3.跟进AI领域的最新动态,优化内部技术方案,提升平台性能,推进AI架构升级。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性