logo of antgroup

蚂蚁金服蚂蚁集团-具身智能推理优化与算子开发工程师-上海

社招全职3年以上LB技术-AI Infra地点:上海状态:招聘

任职要求


1. 计算机及相关专业,本科及以上学历。
2. 具备扎实的 C/C++ 编程能力,良好的数据结构算法基础。
3. 理解操作系统、计算机体系结构和 GPU 并行计算基础。
4. 熟悉 CUDA 编程,有性能分析和优化经验。
5. 熟悉 TensorRT/TRT-LLM,或其他 LLM 推理优化相…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 面向具身智能、多模态 VLA/VLM、机器人策略模型等推理场景,设计并实现高性能 CUDA/C++ 算子。
2. 针对 H系列 GPU 与 RTX 4090 等硬件平台,进行端到端推理性能优化,包括延迟、吞吐、显存占用和稳定性优化。
3. 打通具身模型推理机部署流程,支持模型导出、量化、TensorRT/TRT-LLM 编译、服务化部署与性能 profiling。
4. 有 LLM/VLM/VLA 推理链路中的关键模块的优化经验,包括 attention、KV cache、视觉编码器、动作头、后处理等。
5. 针对跨卡、跨机推理通信场景,开发和优化 NCCL/RDMA/NVLink/PCIe 相关通信算子与调度策略。
包括英文材料
学历+
C+
C+++
数据结构+
算法+
还有更多 •••
相关职位

logo of bytedance
社招A15783

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-16北京
logo of vivo
校招

1、机器人基础模型架构设计与开发:如视觉-语言-动作(VLA)模型的算法研发,包括多模态特征对齐、动作序列生成与推理优化,推动模型在机器人操作场景的端到端能力提升; 2、具身智能多模态系统构建:设计融合视觉、语言与动作的联合训练框架,开发基于Transformer或扩散模型的跨模态交互机制,提升模型在复杂动态环境中的语义理解与决策能力; 3、算法性能优化与工程化:针对具身智能硬件平台(如机械臂、移动机器人)优化VLA等模型的实时推理性能,通过算子融合、量化压缩等技术实现低延迟部署。 4、跨模态数据闭环建设:搭建大规模具身智能数据采集与增强系统,设计数据标注与仿真验证工具链,支撑VLA等模型在真实场景的持续迭代。

更新于 2025-07-25上海|东莞
logo of xpeng
实习

【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其它领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 作为小鹏机器人核心团队的实习生,你将深入参与具身智能(Embodied AI)VLA 大模型的全链路优化工作,主要探索和负责以下领域: 核心职责:参与具身 VLA 大模型的部署优化,熟悉算子优化、模型量化等原理。 技术探索:参与研究和应用最新的大模型结构,探索软硬一体的高效模型部署设计方案,提升模型推理性能。 团队协作:与算法、硬件及基础设施团队紧密合作,共同推进模型从训练到部署的迭代,解决前沿工程技术与算法论文在真实场景中的落地挑战。

更新于 2025-12-30深圳
logo of jd
社招算法开发岗

团队介绍 我们是京东科技云事业部AI Infra团队,致力于大模型核心技术的前沿创新与应用。我们专注于业界领先的大模型创新算法及框架研发,构建极致高效的基础大模型训练、推理与渲染一体化平台,提供高吞吐高可用、低成本低延迟的大模型服务。我们的核心使命是高效支持京东自研和业界主流开源基础模型的训练、推理与渲染服务,驱动京东集团内外部的智能体/具身/全模态等大模型业务生态及应用。我们团队秉承技术驱动、创新为本的理念,为每一位成员提供广阔的成长空间和富有挑战性的项目。 工作内容 1.研发智能体/具身/全模态大模型算法,结合RL Infra后训练基座Scale-Law优化,提高大模型训练、生成和仿真渲染效能; 2.基于MoE/DiT大模型架构,融合样本均衡/多P并行/压缩/量化/剪枝/算子融合等技术,进行算法与系统Co-Design优化,并推动业务落地; 3.追踪业界最新技术进展,开展大模型算法与RL Infra训练、生成和仿真渲染相关创新,发表高影响力论文,打造业界一流的大模型RL Infra服务能力。

更新于 2026-01-20北京