logo of amap

高德地图高德-大模型训练架构研发工程师-AI Infra-信息算法专项

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


1.  工程基础:具备扎实的工程算法基础,精通数据结构算法,能熟练使用编译、调试及性能剖析工具定位系统级问题。
2.  实现能力:拥有出色的工程实现能力,精通C++/Python,具备高性能代码的开发和优化经验。
3.  系统经验:拥有大规模分布式系统或机器学习基础设施的开发和优化经验。
4.  加分项(满足其一或多项即可):1)有大规模模型训练优化经验…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.  构建后训练专用高性能架构,支持从SFT到RLHF/Agentic RL的全流程调优,为RM模型训练、PPO等复杂算法提供千卡级别的超大规模分布式训练支持,攻克特定阶段的性能瓶颈。
2.  打造极致推理与服务引擎,优化针对RLHF/Agentic RL流程中多个模型的交互式推理链路,通过编译优化、动态批处理、量化等技术,实现高吞吐、低延迟的模型服务,确保用户体验的流畅性。
3.  释放异构硬件最大潜能,深入CPU/GPU/NPU等底层硬件,通过CUDA内核定制、通信库优化(如RDMA)及MLIR/TRITON等编译技术,旨在将硬件性能压榨到极致,以应对高德海量用户与场景的挑战。
包括英文材料
算法+
数据结构+
C+++
Python+
分布式系统+
还有更多 •••
相关职位

logo of bytedance
社招A232395

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设; 2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率; 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎; 4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。

更新于 2024-06-06北京
logo of weride
社招3年以上

关于公司 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 文远知行目前的团队既有来自谷歌、微软、亚马逊、苹果、百度、滴滴的高阶工程师,也不乏刚从顶尖高校毕业的青年才俊。来到我们当中,你会发现这是一个专业、专注、有趣、有料的队伍。大家为了一个激动人心而富有挑战的目标走到一起,互相激励、脑力碰撞,为实现产品落地、创造社会价值、推进行业技术而努力。 对有抱负的工程师,还有什么比这更有意义的呢?我们虚位以待,真诚期待技术过硬、志趣相投的小伙伴加入我们! 更多信息请访问:http://www.weride.ai,或关注官方微信号:文远知行WeRide 关于感知Infra - Offboard方向(C++) 对周围环境与事物的感知能力是无人车与机器人技术发展的基础,是目前深度学习技术最前沿的应用之一,也是人工智能目前最具商业潜力的方向,是未来生产力提升的突破口。对于这样一个深度学习系统而言,模型的结构仅仅是冰山一角,围绕模型与应用建立起的工程能力,才是推动算法快速迭代的关键。例如一个应用于机器人的智能算法,需要通过高性能的仿真框架,处理海量的传感器数据,全面评估算法的行为,才能建立起快速的反馈与迭代。Offboard工程师的工作,就是围绕感知系统建立起闭环迭代所需的高效率基础设施,以实现感知系统的快速进化。 基于云原生和 Kubernetes 生态系统,打造高可用和高稳定性的复杂业务系统。 负责训练框架前沿技术的探索和研究,负责分布式训练架构体系的演进。 打造自动驾驶领域的数据闭环系统,自动驾驶大规模离线仿真技术等高水平大模型基础软件。 指导团队内技术工作,规划下一代自动驾驶感知领域离线基础架构技术,引领自动驾驶感知领域的离线基础架构理念变革

更新于 2025-08-01广州
logo of bytedance
社招X1570

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2022-06-30北京
logo of bytedance
社招A196220

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2024-05-11上海