腾讯腾讯云-高性能网络后台研发工程师
社招全职5年以上腾讯云技术地点:上海状态:招聘
任职要求
1.本科及以上学历,人工智能、计算机、数学等相关专业; 2.5年以上AI研发或项目经验,有云计算领域相关经验优先; 3.具备TensorRT,Triton等推理框架和服务部署软件的优化和实践能力; 4.熟悉深度学习框架(Pytorch, Tensorflow,等),熟悉各组件和类库,常见AI模型; 5.熟悉行业内人工智能平台、机器学习实现方案,熟悉主流云计算厂商 AI 产品特点,有 AI 研发经验者…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责计算集群的高性能RDMA网络系统软件开发和建设工作,构建业界领先的集群高性能RDMA网络性能和稳定性; 2.负责业界大模型训练的主流加速框架(如DeepSpeed、Megatron-LM)与云平台底层技术特点和优势结合,通过自研高性能RDMA网络技术进行持续优化; 3.跟踪业界最新AI基础设施和互联网络通信技术建设情况,包括scale up&out网络,持续打造自研产品竞争力。
包括英文材料
学历+
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
Triton Inference Server+
https://docs.nvidia.com/deeplearning/triton-inference-server/user-guide/docs/index.html
Triton Inference Server is an open source inference serving software that streamlines AI inferencing.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位
社招3年以上技术类
1.负责百亿级流量&千万级物料的广告检索引擎系统的研发工作,保障服务的高可用、高性能; 2.负责设计和实现易用&高效的广告检索架构,支撑算法&产品在多团队、多业务、多策略、多模型场景的高效迭代; 3.负责系统C++基础设施建设,提升系统开发效率;
更新于 2025-04-07北京
社招技术类
1、负责出海电商广告搜索、推荐引擎后台服务架构设计,打造高性能、高可用、可扩展的架构,支撑广告业务快速发展; 2、负责出海电商广告业务系统,包括:商家平台/投放中台/运营平台/计费平台/实时大数据平台的开发; 3、负责出海电商广告系统全链路研发和优化, 包括BC端后端服务架构,以及广告索引库、广告检索服务、服务框架、资源管控等模块设计和开发,提高系统性能和扩展性; 4、深刻理解广告业务,抽象和设计合理的技术架构,保证架构的合理性和前瞻性,以适应不断变化的需求; 5、持续优化系统设计,提升系统的性能、可用性、稳定性与可扩展性;
更新于 2025-11-05上海
社招2年以上信息技术类
1.负责召回检索引擎的设计与开发,构建高性能、高并发的分布式架构,支撑搜索与推荐等核心业务场景; 2.负责设计高性能数据结构,支撑海量数据下各种复杂索引结构的低延迟查询; 3.负责检索相关产品的核心功能、公共核心模块的代码编写; 4.与shein业务团队紧密合作,支撑全场景各种复杂业务的上线和迭代需求; 5.探索新技术方向,通过技术创新解决实际问题,推动系统性能和稳定性持续改进。
更新于 2025-06-11南京