logo of didi

滴滴具身智能机器学习算法研发工程师/专家(J250619032)

社招全职技术地点:北京状态:招聘

任职要求


1、计算机、人工智能或相关专业硕士及以上学历,具有深度学习计算机视觉、多模态大模型等相关领域的科研与工程落地经验;
2、编程基本功扎实,编程风格良好,动手能力强;熟练掌握python或者C++;熟练掌握PyTorch;
3、在人工智能顶级国际会议/期刊上发表过论文(如CVPR/ICCV/ECCV/NeurIPS/ICLR/ICML/TPAMI等)的优先;
4、有强烈的自驱力、持续学习的能力以及良好的团队协作能力。

加分项:
1、发表过具身智能、自动…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、研发基于人形机器人平台(轮式、足式)的通用型具身算法,实现在开放世界中自主导航移动、物理交互与操纵任务;
2、研发基于多模态具身大模型、扩散模型等前沿AI技术的多模态(视觉、语言)交互能力,以及机器人行为的智能决策与规划;
包括英文材料
学历+
深度学习+
OpenCV+
大模型+
Python+
C+++
PyTorch+
还有更多 •••
相关职位

logo of didi
社招技术

1、负责人形机器人、机械臂等硬件实体的调校、传感器标定,以及规控算法的设计与工程实践; 2、负责AI模型在机器人硬件系统上的算法部署、性能优化与工程化落地;

更新于 2025-09-26北京
logo of amap
社招3年以上技术类-算法

职位名称: 团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 1. 定义未来地图范式:不再局限于传统视觉感知,而是利用多模态大模型实现从“看到”到“理解并生成”的跨越,解决行业核心痛点 2. 直面海量数据与复杂场景:处理中国乃至全球最复杂、最丰富的驾驶场景数据,构建坚实的技术壁垒 3. 完整的研发生态:从顶级学术研究(顶会论文)、开源项目(见团队GitHub)到国民级应用落地,提供全方位的价值实现舞台 岗位职责: 1. 核心方向:研发面向车道级地图自动化构建的多模态大模型,基于道路图像自动提取车道线、POI信息等地图要素,实现高效、自动化的地图数据生产; 2. 模型全链路研发:负责或参与多模态大模型的预训练、有监督微调(SFT)、奖励模型(RM)训练与强化学习(RL)优化全流程,探索模型在空间推理、结构化生成任务上的能力强化路径; 3. 技术攻坚与落地:优化模型的推理效率、泛化能力与输出稳定性,研究适配的模型压缩(量化、蒸馏)、加速技术与部署方案,推动技术在大规模数据生产管线中落地; 4. 前沿探索与创新:跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展,将其创新性地应用于地图生成问题,持续提升自动化生产的质量与范围。

更新于 2026-03-30北京
logo of aligenie
社招3年以上技术类-算法

职位名称: 团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 1. 定义未来地图范式:不再局限于传统视觉感知,而是利用多模态大模型实现从“看到”到“理解并生成”的跨越,解决行业核心痛点 2. 直面海量数据与复杂场景:处理中国乃至全球最复杂、最丰富的驾驶场景数据,构建坚实的技术壁垒 3. 完整的研发生态:从顶级学术研究(顶会论文)、开源项目(见团队GitHub)到国民级应用落地,提供全方位的价值实现舞台 岗位职责: 1. 核心方向:研发面向车道级地图自动化构建的多模态大模型,基于道路图像自动提取车道线、POI信息等地图要素,实现高效、自动化的地图数据生产; 2. 模型全链路研发:负责或参与多模态大模型的预训练、有监督微调(SFT)、奖励模型(RM)训练与强化学习(RL)优化全流程,探索模型在空间推理、结构化生成任务上的能力强化路径; 3. 技术攻坚与落地:优化模型的推理效率、泛化能力与输出稳定性,研究适配的模型压缩(量化、蒸馏)、加速技术与部署方案,推动技术在大规模数据生产管线中落地; 4. 前沿探索与创新:跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展,将其创新性地应用于地图生成问题,持续提升自动化生产的质量与范围。

更新于 2026-03-30北京
logo of aligenie
社招5年以上技术类-算法

1. 跟踪大模型的国际前沿算法技术动态,定期输出技术调研报告并试点验证,评估其在业务中的应用价值; 2. 负责大模型在端侧/边缘场景的优化与落地,包括模型压缩、推理加速、多模态输入处理与上下文管理; 3. 负责数据计算、运动控制、图像处理算法的研发与优化; 4. 跨团队参与产品的需求评审,制定算法验收标准,配合测试团队完成算法在各应用场景下的效果验证与版本迭代; 5. 主导算法在 RISC-V 架构硬件上的移植、量化与性能优化,确保算法运行的稳定性和实时性; 6. 负责撰写设计方案、接口规范等技术文档,参与专利布局及相关学术论文的撰写;

更新于 2026-04-07杭州|上海