顺丰VLA算法工程师
任职要求
1、人工智能、模式识别或计算机专业的硕士或者博士; 2、数学基础扎实,熟悉概率统计和机器学习相关的理论体系; 3、熟悉主流3D视觉,SLAM/VIO/LIO相关算法及算法库; 4、具备VLA/VLM/LLM等大模型网络设计、…
工作职责
1、负责机器人大模型和室内语义导航技术方案设计与实现; 2、负责任务规划与控制策略,提升系统的泛化性与灵活性,以及物理执行模块高效性; 3、构建面向物流作业场景的VLA数据集与仿真环境;
1. 跟踪VLM/VLA、世界模型、3D生成等前沿技术动态,结合地图领域的专业知识,探索其在智能交通与位置服务中的创新应用; 2. 基于高德海量多源异构数据,参与多模态地图大模型的构建、训练及性能调优; 3. 研发面向静态要素检测、occupancy网格预测及三维场景重建的多模态感知算法,建设复杂城市场景下的空间理解与环境表征能力。
1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。
1. 负责高自由度灵巧手操作算法研发,围绕多指灵巧手抓取、手内操作、柔性物体操作、工具使用等灵巧操作任务; 2. 负责设计并实现基于强化学习(RL)/模仿学习(IL)的操作策略训练框架,推动从单任务策略到多任务统一模型的演进; 3. 负责搭建和优化数据闭环,包括真机数据优化、仿真数据优化、训练集构建与评测体系设计; 4. 负责推动Sim2Real迁移,解决模型在真实机器人系统中的鲁棒性、实时性、泛化性与部署问题; 5. 跟进灵巧操作前沿算法,提升长时序、多阶段操作任务的规划与执行能力,并探索前沿算法在公司产品中的落地。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。