logo of tencent

腾讯腾讯PCG AI Infra团队-高性能计算工程师(深圳/北京/上海)-高性能计算

社招全职2年以上Venus技术地点:深圳状态:招聘

任职要求


1.计算机相关专业本科及以上学历,2年以上高性能计算相关工作经验;
2.熟练掌握C++/Python等编程语言,有大规模并行计算或分布式系统开发经验;
3.深入理解计算机体系结构、并行计算原理,熟悉Nvidia GPU/NPU加速技术;
4.具备Linux系统下的高性能调优经验,熟悉常见性能分析工具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型推理加速引擎一念(https://github.com/Tencent/KsanaLLM)的研发和业务应用,助力业务降本提效;
2.与算法团队、产品团队紧密协作,理解业务需求并提供定制化的高性能计算解决方案;
3.持续跟踪HPC领域的前沿技术,推动新技术在一念的应用与创新;
4.解决高性能计算场景下的复杂技术问题,确保系统的稳定性和可扩展性。
包括英文材料
学历+
C+++
Python+
分布式系统+
还有更多 •••
相关职位

logo of tencent
社招3年以上TEG技术

1.基于开源项目 Ray,打造业内领先的通用分布式计算引擎,包括但不限于以下方向:引擎内核(分布式Task调度与执行)、分布式数据处理框架、分布式在线服务编排框架等; 2.面向 Data + AI,支持和拓展以 Ray 为 infra 的多种业务场景,包括但不限于以下方向:数据科学、大模型训练数据管道服务、在线推理与离线推理、AI Agent与应用系统、隐私计算、图计算等; 3.与 K8S 深度融合,建设云原生环境下超大规模分布式系统的服务能力与平台化能力,为业务提供高可用、可扩展、高易用性的集群化服务; 4.参与开源共建与合作,提升团队与个人在业界的影响力。

更新于 2025-06-09北京
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳
logo of xiaohongshu
社招3年以上机器学习平台

1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系

北京|上海|深圳
logo of baidu
社招ACG

-建设面向AI场景的检索引擎(多维分析、文本检索、向量检索、多模检索等) -负责计算引擎:包括但不限于SQL解析规划器,查询优化器,分布式执行研发和优化 -负责存储引擎:包括单机执行引擎,资源调度,列式存储、存算分离等模块的研发和优化 -负责各集群服务稳定性保障和客户支持

更新于 2025-04-07北京|上海|深圳