腾讯微信-机器学习基础设施开发工程师(存储/向量检索/参数服务器)-系统架构方向
任职要求
1.计算机相关专业本科及以上学历,熟练掌握Linux开发环境,精通至少一门编程语言(C/C++优先),对数据结构与算法有扎实功底,能独立设计高效解决方案; 2.熟悉分布式系统基本原理,对存储引擎、索引构建、网络通信等底层机制有深入理解,具备复杂问题定位与调优能力; 3.具备高度自驱力,主动关注行业技术动态(如分布式存储、向量检索等领域的前沿论文或开源项目),能将新技术合理应用到实际系统中; 4.拥有优秀的沟通表达能力,能清晰阐述技术方案,善于跨团队协作,面对挑战性任务时保持积极…
工作职责
1.负责微信生态内机器学习基础设施组件的研发与维护,重点包括数据存储类组件(如FeatureKV、WeGraphDB、UnionDB)、向量检索系统(如SimOL)及参数服务器(如WePS)等核心模块的开发; 2.深入分析业务需求,针对性优化组件的查询效率、写入吞吐量及资源利用率,持续提升系统性能表现; 3.通过代码重构、架构改进等方式增强组件的易用性,降低业务接入门槛,同时保障高可用性,确保服务SLA达到99.9%以上; 4.紧密结合微信推荐系统、大语言模型等业务的实际场景,收集用户反馈并迭代组件功能,解决业务落地过程中的技术瓶颈; 5.参与技术方案评审与故障排查,输出高质量的技术文档,沉淀最佳实践经验。
1.负责微信读书后台核心系统的架构设计和开发; 2.负责分布式存储、消息队列、网络框架等基础设施的维护与研发; 3.负责算法工程相关技术的研发与落地; 4.负责日常版本需求的架构设计与开发,推动前后端方案落地与联调; 5.负责日常后台性能优化和可用性提升改造。
1.业务需求洞察与转化:; 2.深入对接业务线(如算法团队、司内业务部门),理解大模型在应用场景中的业务痛点,输出产品需求文档并推动优先级共识; 3.深入分析行业痛点(如客服、内容生成、3D建模等),输出定制化解决方案,推动产品适配性优化; 4.平台能力构建与体验提升:; 5.主导设计大模型全生命周期管理功能,涵盖数据标注、模型训练、效果评测、部优化等环节的核心模块,构建大模型全生命周期管理闭环,重点突破高并发训练、分布式推理、多模态模型兼容等能力; 6.设计面向开发者的低门槛工具链(如可视化Prompt编排、一键式模型微调),提升平台DAU/留存率; 7.端到端功能交付与落地; 8.独立负责功能从PRD设计到上线的全流程管理,协调研发、测试、算法团队资源,确保技术方案与业务目标的强对齐; 9.建立关键指标(如模型迭代周期、资源利用率、用户满意度),通过数据验证功能价值; 10.主导交付后的用户培训、反馈收集及问题闭环; 11.跨团队协同与项目管理; 12.推动业务方、工程团队、算法团队三方协作; 13.推动太极在腾讯生态产品(如微信、腾讯文档、腾讯会议)中的深度合作与能力共建。
1.负责视频号短视频业务的推荐技术优化,包括但不限于召回、粗排、精排、重排、视频冷启动等; 2.负责视频号短视频业务的业务策略优化,包含但不限于人群优化、社交推荐、内容生态等; 3.负责若干前瞻方向的探索,包括LLM4Rec、推荐大模型、生成式推荐等方向。