logo of tencent

腾讯微信-后台开发高级工程师-大模型训练框架方向(上海)

社招全职2年以上WXG技术地点:北京状态:招聘

任职要求


1.计算机相关专业本科及以上学历,2年以上相关开发经验,具备良好的工程素养;
2.熟悉某一深度学习训练框架,如 PyTorchTensorFlowMegatron-LM、DeepSpeed、Transformers 等,有底层优化或开源经验;
3.具备良好的沟通能力和团队协作精神,积极主动,勇于接受挑战。

加分项
1.有昇腾、Gaudi等 ASIC 算力设备上的开发经验;
2.熟悉大模型算法,设计方案时能做算法和工程的协同设计;
3.实际进行百卡以上的训练任务,并对训练性能做过调优。

工作职责


1.研发微信内通用的大模型训练框架 gCore 的研发,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求。通过并行策略和算子优化,使得 gCore 在不同的模型上都能达到 SOTA 的训练吞吐。
包括英文材料
学历+
深度学习+
PyTorch+
TensorFlow+
Megatron+
DeepSpeed+
大模型+
算法+
相关职位

logo of tencent
社招2年以上WXG技术

1.研发微信内通用的大模型训练框架 gCore 的研发,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求。通过并行策略和算子优化,使得 gCore 在不同的模型上都能达到 SOTA 的训练吞吐。

更新于 2025-05-28
logo of tencent
社招WXG技术

1.跟进业界最新推理框架并应用于业务,保障业务的多机多卡模型训练与推理部署; 2.参与企业微信机器学习、深度学习模型落地的工程化开发,优化AI推理服务的可用性和稳定性; 3.带领团队高效率高质量完成大模型业务落地。

更新于 2025-06-18
logo of tencent
社招WXG技术

1.跟进业界最新推理框架并应用于业务,保障业务的多机多卡模型训练与推理部署; 2.参与企业微信机器学习、深度学习模型落地的工程化开发,优化AI推理服务的可用性和稳定性; 3.带领团队高效率高质量完成大模型业务落地。

更新于 2025-05-21
logo of tencent
社招2年以上微信技术

随着视频号业务发展以及大模型 AI 能力的突破,视频号业务与大模型结合努力尝试,希望在视频创作等场景进行结合落地。为了保证需求快速高质量的迭代,希望邀请热爱技术的你,一起攻克这些难题。 1.为推荐场景提供高性能的可靠特征计算能力; 2.对模型服务性能做极致优化,保证需求的快速迭代和高质量稳定运行; 3.结合业务场景对模型进行管理调度以及针对性优化,提升业务的稳定性; 4.完成内部AI应用研效工具建设,帮助产品迅速落地想法,提升迭代效率。

更新于 2025-06-10