logo of tencent

腾讯腾讯云-集合通信高级研发工程师

社招全职3年以上腾讯云-网络技术地点:深圳状态:招聘

任职要求


1.本科及以上学历,通信、电子、计算机相关专业毕业,3年及以上相关工作经验;
2.熟练掌握并深入了解DL框架实现原理(优先PytorchTensorflow);
3.熟悉通信库NCCL, MPI,libfrabic等开源组件,有过AI训练等集合通信网络调优经验;
4.熟悉RDMA和TCP协议,有RDMA高性能网络设计及运营经验,有丰富verbs编程经验;
5.熟练掌握PythonC++,有社区开发经验者优先。

工作职责


1.支持腾讯云客户在AI场景中网络和集合通信的性能调优;
2.AI场景不同机型上网络和集合通信方面的适配优化;
3.集合通信库及配套解决方案的研发优化,提升腾讯云HCC产品在通信层面的竞争力。
包括英文材料
学历+
PyTorch+
TensorFlow+
Python+
C+++
Message Passing Interface+
相关职位

logo of oppo
社招1-6年SOFTWARE

1、负责小布助手多模态交互和语音算法工程服务等核心业务的研发落地和实施 2、协助产品经理保质保量的完成产品交付

更新于 2025-08-26
logo of mi
社招5年以上F6871

1.参与验证面向高性能一致性 SOC总线验证; 2.跟设计团队紧密合作,制定验证计划,编写测试用例,debug; 3.功能覆盖率收集与分析,增强测试集合以解决覆盖率漏洞; 4.探索总线验证方法学,参与构建验证环境,研发验证工具,学习相关领域前沿技术。

更新于 2023-02-13
logo of aliyun
社招3年以上云智能集团

1. 负责云通信国际融合产品核心产品功能开发与版本迭代,保证产品能力快速迭代和高质量交付 2. 负责云通信融合产品与能力开放平台基础框架开发,兼顾传统接口式编程范式以及大模型编程范式,保证系统鲁棒性的同时考虑业务扩展性 3. 负责大语言模型应用层开发与落地,包括但不限于生成ChatFlow,智能对话生成,知识问答、数据分析等场景 4. 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的新技术信息,包括但不限于技术原理、技术优劣势、应用场景等 5. 分析竞对产品的核心技术指标和发展方向,通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察、选型以及协助产品经理构建产品发展规划 6. 指导和培养团队成员,包括评审设计文档和代码 7. 参与平台整体系统的架构设计与演进规划,结合业务实际情况综合考虑系统的安全性、稳定性、可扩展性、性能和使用体验,对系统持续优化,确保能够满足持续发展的业务形态与规模对基础平台能力的需求

更新于 2025-09-18
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发; ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本;

更新于 2025-04-03