logo of tencent

腾讯技术研究-高性能计算方向

实习兼职实习生地点:深圳 | 北京 | 上海状态:招聘

任职要求


1、扎实的计算机体系结构基础,熟悉并行计算、数据密集型系统设计;
2、良好的数学基础(线性代数、数值分析、算法复杂度优化)。

加分项
1、有TensorRT/Triton Inference Server等推理框架经验者优先;
2、深入理解TCP/IP、RDMA协议栈,熟悉DPDK/SPDK开发、有超算中心或云计算网络调优经验者优先;
3、熟悉Transformer架构及主流大模型训练流程。

工作职责


包含GPU、网络、大模型框架等细分方向。

1、针对业务需求,解决算力瓶颈、通信延迟、分布式系统扩展性等问题;
2、协同算法、硬件及运维团队,构建高效、稳定的计算基础设施。

1)GPU方向:研究GPU集群的调度策略,优化资源利用率。探索混合精度计算、模型量化等GPU加速技术;
2)网络方向:设计低延迟、高吞吐的分布式网络架构(如InfiniBand/RoCE/DPU)。优化MPI、NCCL等通信库性能,解决大规模集群中的网络拥塞问题;
3)大模型工程框架方向:开发或优化大模型训练框架(如PyTorch/TensorFlow/DeepSpeed/Megatron-LM),设计分布式训练策略(模型并行、流水线并行、混合并行),提升千亿级参数模型的训练效率。研究训练加速技术(梯度压缩、显存优化、动态计算图调度)。
包括英文材料
系统设计+
算法+
TensorRT+
TCP/IP+
Transformer+
大模型+
相关职位

logo of tencent
校招青云计划-实习生

包含GPU、网络、大模型框架等细分方向。 1、针对业务需求,解决算力瓶颈、通信延迟、分布式系统扩展性等问题; 2、协同算法、硬件及运维团队,构建高效、稳定的计算基础设施。 1)GPU方向:研究GPU集群的调度策略,优化资源利用率。探索混合精度计算、模型量化等GPU加速技术; 2)网络方向:设计低延迟、高吞吐的分布式网络架构(如InfiniBand/RoCE/DPU)。优化MPI、NCCL等通信库性能,解决大规模集群中的网络拥塞问题; 3)大模型工程框架方向:开发或优化大模型训练框架(如PyTorch/TensorFlow/DeepSpeed/Megatron-LM),设计分布式训练策略(模型并行、流水线并行、混合并行),提升千亿级参数模型的训练效率。研究训练加速技术(梯度压缩、显存优化、动态计算图调度)。

logo of tencent
实习Pre留学生实习

包含GPU、网络、大模型框架等细分方向。 1、针对业务需求,解决算力瓶颈、通信延迟、分布式系统扩展性等问题; 2、协同算法、硬件及运维团队,构建高效、稳定的计算基础设施。 1)GPU方向:研究GPU集群的调度策略,优化资源利用率。探索混合精度计算、模型量化等GPU加速技术; 2)网络方向:设计低延迟、高吞吐的分布式网络架构(如InfiniBand/RoCE/DPU)。优化MPI、NCCL等通信库性能,解决大规模集群中的网络拥塞问题; 3)大模型工程框架方向:开发或优化大模型训练框架(如PyTorch/TensorFlow/DeepSpeed/Megatron-LM),设计分布式训练策略(模型并行、流水线并行、混合并行),提升千亿级参数模型的训练效率。研究训练加速技术(梯度压缩、显存优化、动态计算图调度)。

logo of tencent
校招青云计划-应届生

包含GPU、网络、大模型框架等细分方向。 1、针对业务需求,解决算力瓶颈、通信延迟、分布式系统扩展性等问题; 2、协同算法、硬件及运维团队,构建高效、稳定的计算基础设施。 1)GPU方向:研究GPU集群的调度策略,优化资源利用率。探索混合精度计算、模型量化等GPU加速技术; 2)网络方向:设计低延迟、高吞吐的分布式网络架构(如InfiniBand/RoCE/DPU)。优化MPI、NCCL等通信库性能,解决大规模集群中的网络拥塞问题; 3)大模型工程框架方向:开发或优化大模型训练框架(如PyTorch/TensorFlow/DeepSpeed/Megatron-LM),设计分布式训练策略(模型并行、流水线并行、混合并行),提升千亿级参数模型的训练效率。研究训练加速技术(梯度压缩、显存优化、动态计算图调度)。

logo of antgroup
实习蚂蚁技术研究院长

职位描述: 1.探索各类软硬件结合的优化手段,充分挖掘并不断逼近现代计算机体系结构下在线/近线/离线图计算系统的性能极限; 2.开展与其它相关领域/学科结合的交叉研究,拓宽图计算的应用范围; 3.解决前沿的图计算技术问题,将相应成果以论文形式发表到顶尖学术会议/期刊,并与研发团队协作落地到实际场景; 4.研究方向包括但不限于:云原生高性能图存储,图数据库查询优化,超大规模图数据仓库,多模态图计算系统,面向自然科学的图计算应用,图智能技术,等等。