腾讯微信基础-语音大模型算法工程师
任职要求
1.硕士或博士学位,机器学习、人工智能、数字信号处理或相关领域的专业背景; 2.深入理解语音音频信号处理、声学建模、语言模型和大模型架构; 3.在语音合成、语音识别、声纹识别中至少一个领域有深入研究和扎实的实践经验;熟悉多个领域者优先; 4.有…
工作职责
1.研发具备通用能力的端到端语音大模型,包括多语种语音识别、语音合成、声纹识别、副语言信息理解等; 2.推动上述语音技术与团队内部大语言模型 (LLM) 的深度融合,参与设计和实现智能语音交互系统架构; 3.在微信AI探索业务中,基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。
【关于我们】 点点是小红书新一代生活场景AI搜索助手,依托DeepSeek大模型 + 小红书海量真实笔记 + 全网经验,为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,已形成独立App、微信小程序 + 小红书站内“问点点”全域布局。 “用增方向”(用户增长)是点点的核心战略引擎,当前重点通过外部流量平台投放(抖音、快手、B站、微博、小红书生态外渠道、搜索广告等)驱动新用户获取、激活与留存,实现DAU快速规模化增长。我们正在构建高效的投放增长闭环:从创意素材生成、投放策略优化、实时效果监控,到用户全链路转化漏斗优化,推动点点成为年轻人日常必备的“生活搜索神器”。 我们期待对内外部流量投放增长有深度实战、对AI产品冷启动与规模化增长敏感、对数据驱动决策有极致追求的资深后端同学,一起把点点从“有用”做到“让人上瘾、规模爆发”! 【岗位职责】 1、负责点点内外部流量投放增长系统的核心架构设计与开发,包括投放数据实时采集、策略引擎、预算分配、创意分发、A/B实验平台、转化归因链路等; 2、构建高并发、低延迟的投放决策与监控服务,支持日均亿级曝光、千万级点击的实时个性化投放与动态调优; 3、设计并实现跨平台投放统一中台,打通抖音、快手、B站、微博、搜索广告(百度/字节/腾讯系)等多渠道数据与投放接口,实现统一调度、预算智能分配、ROI实时优化; 4、建设增长实验平台与效果分析体系,支持快速测试投放创意、落地页、渠道策略、用户分层等,驱动新用户获取成本持续下降、激活/留存率显著提升; 5、与算法(推荐/召回/创意生成)、客户端、数据、运营团队深度协作,推动外部流量 → App/小程序激活 → 多轮交互 → 留存的闭环增长; 6、优化系统性能、稳定性与成本控制,支撑高峰期QPS与低延迟,确保投放链路99.99%可用性; 7、参与增长基础设施建设(如实时特征平台、埋点治理、归因模型、反作弊体系等),赋能投放增长效率翻倍。
1.负责多模态内容理解、多模态生成等算法技术在视频剪辑、多模态理解和生成业务上的落地工作:; 2.图像、视频、语音等多模态内容理解和生成算法的模型设计、训练、优化; 3.文生图、文生视频、图生视频等算法的探索和落地; 4.实现模型轻量化(知识蒸馏、量化剪枝)及推理加速,满足低延迟需求; 5.跟踪多模态大模型、世界模型等前沿方向,探索业务结合点。
1、聚焦小红书大前端领域的 AI Coding 探索,从需求分析到上线,全流程推动 AI 驱动开发(如使用 RAG、MCPs 和 UI 还原对抗技术),提升编码准确度与研发效率,实现研发模式的颠覆性创新; 2、负责小红书社区 C 端核心场景(如地图、兴趣话题、创作中心)的 React Native 跨端架构设计与实现,确保高性能、高可用性; 3、负责基础产品和创作者服务,包括社区话题、创作中心/创作服务平台及微信小程序,通过模块化架构支持业务快速迭代; 4、参与社区 S 级运营活动开发,运用动态化技术拓宽用户内容心智,提升用户参与度和社区活跃度; 5、推动多端 Web 业务架构演进,聚焦体验优化和性能稳定性,构建下一代响应式 Web 应用。