logo of tencent

腾讯技术研究-高性能计算方向

实习兼职Pre留学生实习地点:北京状态:招聘

任职要求


1、扎实的计算机体系结构基础,熟悉并行计算、数据密集型系统设计;
2、良好的数学基础(线性代数、数值分析、算法复杂度优化)。

加分项
1、有TensorRT/Triton Inference Se…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


包含GPU、网络、大模型框架等细分方向。

1、针对业务需求,解决算力瓶颈、通信延迟、分布式系统扩展性等问题;
2、协同算法、硬件及运维团队,构建高效、稳定的计算基础设施。

1)GPU方向:研究GPU集群的调度策略,优化资源利用率。探索混合精度计算、模型量化等GPU加速技术;
2)网络方向:设计低延迟、高吞吐的分布式网络架构(如InfiniBand/RoCE/DPU)。优化MPI、NCCL等通信库性能,解决大规模集群中的网络拥塞问题;
3)大模型工程框架方向:开发或优化大模型训练框架(如PyTorch/TensorFlow/DeepSpeed/Megatron-LM),设计分布式训练策略(模型并行、流水线并行、混合并行),提升千亿级参数模型的训练效率。研究训练加速技术(梯度压缩、显存优化、动态计算图调度)。
包括英文材料
系统设计+
算法+
TensorRT+
还有更多 •••
相关职位

logo of bytedance
社招A172997

1、负责边缘大模型网关,边缘推理等产品化工作; 2、负责安全、高可靠性、高性能的端边云算力协同平台建设; 3、掌握业界前沿的技术,持续探索在各种边缘场景下的AI解决方案。

更新于 2025-03-03北京
logo of kuaishou
社招D7198

1.参与AI与GPU相关项目的性能优化与研发,通过利用并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜广推、音视频以及大模型场景,优化大模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-04-10北京
logo of tencent
社招3年以上TEG技术

1.负责对象存储文档、图片、视频等数据的处理服务架构设计与研发工作; 2.负责对象存储文档、图片以及视频编解码方向特性的把控,并推动相关工程化的实现与落地; 3.持续优化数据处理流程,提升系统性能与稳定性。

更新于 2026-01-10深圳
logo of aliyun
社招3年以上云智能集团

● 设计和实现高效的分布式推理架构,提升多节点、多GPU环境下的推理速度和资源利用率。开发智能的请求调度算法,确保高并发场景下的最优响应时间和吞吐量。对推理引擎的运行时环境进行深度优化,减少延迟,提高整体性能。针对多种异构AI加速硬件(如NVIDIA GPU, AMD GPU, NPU等),对核心算子进行极致性能优化,最大化算力和访存带宽利用率。 ● 探索并实现极低bit量化技术和稀疏化,减少模型存储和计算资源消耗,同时保持推理精度。探索更高效的解码算法,提升生成任务的推理速度。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。引入容错机制、自动恢复和监控报警系统,保证系统的高可用性和稳定性。构建灵活的系统架构,支持动态扩展,以应对未来业务增长和技术演进的需求。 ● 持续关注并跟进业界技术发展,尤其是超长上下文、COT思维链、多模态融合等方向。积极尝试和探索新的推理优化方向,提出并验证创新性的解决方案。

更新于 2025-09-10北京|杭州|上海