logo of tencent

腾讯微信-基础大模型训练框架高级研发工程师

社招全职WXG技术地点:北京状态:招聘

任职要求


1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与开发优化大模型训练框架,支持大规模高效稳定训练;
2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。
包括英文材料
PyTorch+
大模型+
还有更多 •••
相关职位

logo of tencent
社招WXG技术

1.参与开发优化大模型训练框架,支持大规模高效稳定训练; 2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。

更新于 2025-06-04深圳
logo of tencent
社招微信技术

1.设计、开发和优化机器学习模型,应用于微信小店及微信交易的内容审核、风险控制、商家行为监管和用户安全等治理场景; 2.基于海量的数据,进行数据清洗、特征提取、模型训练和评估,提升平台违规行为检测的准确性和效率; 3.参与反作弊、负向信息过滤、虚假交易检测等关键系统的算法研发和优化,维护平台生态健康; 4.持续跟踪机器学习领域的前沿技术和应用,推动新技术在平台治理中的落地和创新; 5.根据平台实际业务需求,开发并维护可扩展、高效的算法框架和工具,提升治理系统的稳定性和灵活性。

更新于 2025-05-27广州
logo of tencent
社招2年以上微信APP基础体

1.研究AI模型推理加速技术在微信业务中的应用,参与TFCC服务平台和推理引擎的研发与优化,提升推荐模型、大模型、传统中小模型等业务场景的推理性能; 2.负责微信后台AI算法的工程应用与优化,支持语音识别、语音合成、视觉理解、大语言模型等业务的后台工程开发与优化; 3.跟进AI领域的最新动态,优化内部技术方案,提升平台性能,推进AI架构升级。

更新于 2026-02-03广州
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳