美团AI计算高性能内核工程师
任职要求
1. 有扎实的计算机理论基础;熟练掌握常用数据结构和算法; 2. 熟练掌握CUDA编程、GPU架构,或具备国产AI设备编程经验者优先; 3. 熟悉AI模型高性能kernel开发,具备G…
工作职责
1. 参与超大规模的 AI 大模型训练、推理平台建设,聚焦大模型场景高性能算子、模块研发。 2. 负责研发大模型场景下“高性能训推算子模块”,提升大模型平台MFU/MBU。具体包括:a) 基于AI硬件深度理解,针对美团大模型场景研发创新性高性能模块;b) 协同框架算法设计研发平台训推技术方案;c) 调研分析业界最前沿技术方案,等等。 3. 参与搜广推场景模型训练推理核心模块研发,手段包括且不限于:AI编译器,DSL,专家级优化。
1. 参与超大规模的 AI 大模型训练、推理平台建设,聚焦大模型场景高性能算子、模块研发。 2. 负责研发大模型场景下“高性能训推算子模块”,提升大模型平台MFU/MBU。具体包括:a) 基于AI硬件深度理解,针对美团大模型场景研发创新性高性能模块;b) 协同框架算法设计研发平台训推技术方案;c) 调研分析业界最前沿技术方案,等等。 3. 参与搜广推场景模型训练推理核心模块研发,手段包括且不限于:AI编译器,DSL,专家级优化。
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。 -负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化; -负责大规模AI计算通信库及通信算法开发与优化; -负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速; -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化。
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责GPU中央算力池的建设和运维工作,通过更合理的资源调度策略,创造更多AI算力; 2、负责全集团GPU数据的采集、加工和挖掘工作,依靠数据支撑,做好整个集团的GPU管理工作,包括:预算、交付、资源提效、二次利用等。
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。 -负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化; -负责大规模AI计算通信库及通信算法开发与优化; -负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速; -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化。