logo of tencent

腾讯腾讯云-异构计算研发工程师

社招全职5年以上腾讯云技术地点:深圳状态:招聘

任职要求


1.人工智能、计算机、数学等相关专业;
2.5年以上 AI 研发或项目经验,有云计算领域相关经验优先;
3.具备TensorRTTriton等推理框架和服务部署软件的优化和实践能力;
4.熟悉深度学习框架(Pytorch, Tensorflow,等),熟悉各组件和类库,常见AI模型;
5.熟悉行业内人工智能平台、机器学习实现方案,熟悉主流云计算厂商 AI 产品特点,有 AI 研发经验者优先;
6.熟悉业界流行的显卡虚拟化技术,对Nvidia/AMD/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责高性能计算集群的平台开发和建设工作,构建业界领先的集群算力调度能力、集群网络管理监控能力、集群故障发现和迁移自愈等能力;
2.负责主流 AI 框架的云平台适配和性能调优工作,针对业界大模型训练,将主流加速框架(如DeepSpeed、Megatron-LM)结合云平台底层技术特点和优势,打造具备差异化竞争力的 AI 加速平台产品能力;
3.负责主流 AI 模型训练和推理性能优化调优工作,提升 AI 推理业务快速部署能力,提供平台算法优化加速能力,能够灵活使用 Triton,TensorRT 等业界主流推理服务和组件,深度结合云原生产品技术架构优势,输出面向不同场景的性能加速最佳实践解决方案;
4.负责跟踪 AI行业技术发展趋势,并进行深度探索分析,协同产品制订 AI 技术发展路线和产品规划;
5.探索自研AI芯片分布式训练与推理云化能力,打造自研 AI 芯片一体化解决方案能力。
包括英文材料
TensorRT+
Triton Inference Server+
深度学习+
PyTorch+
TensorFlow+
还有更多 •••
相关职位

logo of tencent
社招TEG技术

1.负责广告等业务中稀疏大模型,稠密大模型的异构推理架构优化,提升服务性能,降低业务成本; 2.负责广告等业务中GPU算子,计算图编译优化等业务开发,支撑业务迭代升级; 3.积极跟进GPU等异构硬件的业内前沿技术,持续完善异构推理加速框架。

更新于 2025-06-12北京
logo of antgroup
社招2年以上技术类-开发

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。 ● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。 ● 持续跟踪行业前沿技术,参与开源社区的贡献。

更新于 2025-12-01北京|杭州
logo of bytedance
社招A16530

1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。

更新于 2023-11-30上海
logo of bytedance
社招A196810

1、负责研发AI推理框架,适配并优化国产异构计算芯片,支持抖音、剪映等产品中的生成式算法落地,支撑字节跳动AI方向重要业务的发展; 2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。

更新于 2024-05-24上海