logo of netease

网易AI Infra研发工程师

社招全职网易有道地点:北京状态:招聘

任职要求


1. 统招本科及以上学历;
2. 精通C/C++python编程,熟悉常用数据结构;
3. 了解transformer的结构,了解模型训练、微调和推理的过程和原理;
4. 热爱技术,可以快速学习新技术,快速掌握HPC和AI前沿技术;
5. 有以下一项或多项技术能力者优先:
 * 有GPU、NPU、ARM、或其他AI芯片等平台上AI落地实践经验;
 * 熟悉并行计算和分布式计算技术,有 MPI、OpenMP、CUDA 等编程经验,或有PTX、汇编优化方法;
 * 熟悉模型训练框架如Deepspeed、Megatronpytorch等;
 * 熟悉TensorRT-LLMvLLM、sglang等任一推理框架,有实际操作经验;
 *熟悉多层次的软件优化经验,如模型剪枝/量化/压缩、分布式优化(PD分离)、存储优化、kv-cache优化、动态Batching、IO优化、算子/指令集优化等。

工作职责


1. 结合HPC和AI前沿技术,设计和优化大模型训练和推理框架,负责模型优化、算子优化、图优化、分布式优化等,提升计算效率;
2. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线等工作。
包括英文材料
学历+
C+
C+++
Python+
数据结构+
Transformer+
HPC+
CUDA+
Megatron+
PyTorch+
TensorRT+
大模型+
vLLM+
缓存+
相关职位

logo of kuaishou
校招J1020

1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率; 2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本; 3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作; 4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。

更新于 2025-07-30
logo of tencent
社招5年以上CSIG技术

1.负责 deepseek 等AI大模型在 K8s 上的推理部署方案研发,深度对接客户场景; 2.负责AI Infra相关能力在TKE的落地,如AI 相关工作负载的设计与研发,降低用户使用成本; 3.通过优化 AI 部署的计算、网络、存储相关资源,提升训练及推理效率; 4.负责推理稳定性、亲和性调度、推理框架优化、GPU池化等相关工作,降低推理成本,提升推理效率。

更新于 2025-06-05
logo of kuaishou
实习J1020

1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率; 2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本; 3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作; 4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;

更新于 2025-03-31
logo of mi
校招

1. 负责视觉算法在手机平台上的实现和落地; 2. 负责模型优化、模型量化和模型压缩相关研发工作; 3. 负责端侧异构计算框架和AI推理引擎的设计和开发。 【课题名称】 ai infra研发 【课题内容】 1. 端侧ai infra技术研发,包括cpu/gpu/dsp异构处理器开发,端侧异构计算框架设计和开发; 2. AI推理引擎的设计和开发; 3. 模型压缩/量化技术研究和开发。

更新于 2025-06-25