腾讯腾讯云-集合通信高级研发工程师
社招全职3年以上腾讯云-网络技术地点:深圳状态:招聘
任职要求
1.本科及以上学历,通信、电子、计算机相关专业毕业,3年及以上相关工作经验; 2.熟练掌握并深入了解DL框架实现原理(优先Pytorch、Tensorflow); 3.熟悉通信库NCCL, MPI,libfrabic等开源组件,有过AI训练等集合通信网络调优经验; 4.熟悉RDMA和TCP协议,有RDMA高性能网络设计及运营经验,有丰富verbs编程经验; 5.熟练掌握Python和C++,有社区开发经验者优先。
工作职责
1.支持腾讯云客户在AI场景中网络和集合通信的性能调优; 2.AI场景不同机型上网络和集合通信方面的适配优化; 3.集合通信库及配套解决方案的研发优化,提升腾讯云HCC产品在通信层面的竞争力。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Message Passing Interface+
https://www.youtube.com/watch?v=7huftuXExV0
Parallel programming and MPI are crucial tools for achieving high performance computing.
[英文] 📺Basics of the Message Passing Interface (MPI) to program distributed memory parallel computers
https://www.youtube.com/watch?v=tm8M5H1OZmw
The Message Passing Interface (MPI) is a widely used standard to program distributed message parallel computers.
相关职位
社招5年以上F6871
1.参与验证面向高性能一致性 SOC总线验证; 2.跟设计团队紧密合作,制定验证计划,编写测试用例,debug; 3.功能覆盖率收集与分析,增强测试集合以解决覆盖率漏洞; 4.探索总线验证方法学,参与构建验证环境,研发验证工具,学习相关领域前沿技术。
更新于 2023-02-13
社招3年以上云智能集团
1. 负责云通信国际融合产品核心产品功能开发与版本迭代,保证产品能力快速迭代和高质量交付 2. 负责云通信融合产品与能力开放平台基础框架开发,兼顾传统接口式编程范式以及大模型编程范式,保证系统鲁棒性的同时考虑业务扩展性 3. 负责大语言模型应用层开发与落地,包括但不限于生成ChatFlow,智能对话生成,知识问答、数据分析等场景 4. 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的新技术信息,包括但不限于技术原理、技术优劣势、应用场景等 5. 分析竞对产品的核心技术指标和发展方向,通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察、选型以及协助产品经理构建产品发展规划 6. 指导和培养团队成员,包括评审设计文档和代码 7. 参与平台整体系统的架构设计与演进规划,结合业务实际情况综合考虑系统的安全性、稳定性、可扩展性、性能和使用体验,对系统持续优化,确保能够满足持续发展的业务形态与规模对基础平台能力的需求
更新于 2025-09-18