logo of tencent

腾讯微信-基础大模型训练框架高级研发工程师

社招全职WXG技术地点:北京状态:招聘

任职要求


1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与开发优化大模型训练框架,支持大规模高效稳定训练;
2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。
包括英文材料
PyTorch+
大模型+
还有更多 •••
相关职位

logo of tencent
社招WXG技术

1.参与开发优化大模型训练框架,支持大规模高效稳定训练; 2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。

更新于 2025-06-04深圳
logo of tencent
社招2年以上微信APP基础体

1.研究AI模型推理加速技术在微信业务中的应用,参与TFCC服务平台和推理引擎的研发与优化,提升推荐模型、大模型、传统中小模型等业务场景的推理性能; 2.负责微信后台AI算法的工程应用与优化,支持语音识别、语音合成、视觉理解、大语言模型等业务的后台工程开发与优化; 3.跟进AI领域的最新动态,优化内部技术方案,提升平台性能,推进AI架构升级。

更新于 2026-02-03广州
logo of tencent
社招微信技术

1.设计、开发和优化机器学习模型,应用于微信小店及微信交易的内容审核、风险控制、商家行为监管和用户安全等治理场景; 2.基于海量的数据,进行数据清洗、特征提取、模型训练和评估,提升平台违规行为检测的准确性和效率; 3.参与反作弊、负向信息过滤、虚假交易检测等关键系统的算法研发和优化,维护平台生态健康; 4.持续跟踪机器学习领域的前沿技术和应用,推动新技术在平台治理中的落地和创新; 5.根据平台实际业务需求,开发并维护可扩展、高效的算法框架和工具,提升治理系统的稳定性和灵活性。

更新于 2025-05-27广州
logo of tencent
社招5年以上企业微信SaaS

1.负责机器学习模型、深度学习模型在企业微信的落地,包括但不限于对大模型的RL、SFT、强化学习; 2.负责探索与跟进AIGC前沿技术,推动技术框架持续迭代升级,保持行业同类竞品前沿水平; 3.带领团队高效率高质量完成深度学习模型落地。

更新于 2025-11-21成都