logo of vivo

vivo机器人VLA大模型专家

社招全职5年以上研发类地点:上海 | 东莞状态:招聘

任职要求


1、专业背景:计算机视觉、机器人学、自然语言处理等相关专业博士学历,研究方向聚焦多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)精通PyTorch/TensorFlow框架,掌握VLA模型(如RT-2、OpenVLA、Diffusion Policy)的改进与部署,熟悉强化学习、模仿学习等技术;
(2)熟悉多模态对齐技术(CLIP、DINOv2等),具备视觉语言模型(VLM)与动作生成模块的联合调优经验; 
(3)掌握机器人操作系统(ROS/ROS2),有机器人感知-决策-控制全链路开发经验者优先。
3、经验要求:
(1)5年以上多模态算法研发经验,主导过VLA相关项目(如自动驾驶、机械臂操作等)并实现商业化落地;
(2)在NeurIPS/ICML/CoRL等顶级会议发表VLA相关论文,或持有具身智能领域核心专利。

工作职责


1. VLA模型架构创新与研发: 主导机器人视觉-语言-动作(VLA)大模型的架构设计、算法研发与实现,攻克多模态特征高效对齐、动作序列生成与推理优化等关键技术,显著提升模型在机器人操作、自动驾驶等复杂任务中的端到端执行能力;
2. 机器人多模态智能系统构建: 设计并实现融合视觉、语言与动作信号的联合训练框架,研发基于Transformer或扩散模型的跨模态交互与理解机制,提升模型在动态复杂环境下的语义理解、情境推理与决策能力;
3. 模型高效部署与优化: 面向具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推理性能,运用算子融合、量化压缩、模型剪枝等前沿技术,实现模型在边缘设备的高效、低延迟部署;
4. 跨模态数据闭环体系搭建: 构建面向具身智能的大规模、高质量数据采集、增强与标注系统,开发仿真验证工具链,建立数据驱动的模型迭代闭环,持续提升VLA模型在真实场景下的鲁棒性与泛化能力。
包括英文材料
OpenCV+
NLP+
学历+
大模型+
PyTorch+
TensorFlow+
强化学习+
ROS+
算法+
自动驾驶+
NeurIPS+
ICML+
相关职位

logo of xpeng
社招

1、负责自动驾驶、机器人领域VLA算法研发。

更新于 2025-01-13
logo of horizon
社招算法序列

负责机器人领域端侧大模型的研发和应用,研判大模型未来发展趋势为后续芯片NPU规划提供输入。主要工作方向包括: 1. 探索LLM、VLM、VLA大模型在端侧性能与精度极限 2. 跟进与判断大模型发展趋势为后续芯片NPU规划提供输入

更新于 2025-08-18
logo of mi
社招A210746

负责VLA(视觉-语言-行动)多模态大模型在自动驾驶和机器人场景中的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力; 主导VLA模型预研,构建可泛化、高可解释性的多模态基座大模型,为未来6~12个月技术演进提供基础支撑; 与高校及实习生协作,探索VLA的长期发展方向,包括表征学习,具身智能、慢系统蒸馏快系统等核心议题; 撰写高水平论文、技术文档,推动VLA方向在CVPR、NeurIPS、ICLR、CoRL等会议中的学术影响力。

更新于 2025-03-26
logo of sf
社招5-10年

1、跟踪前沿技术进展,负责机器人大模型(VLA)和数字孪生技术能力建设; 2、负责物流机器人方向技术路线制定、技术方案设计与评审、业务应用落地; 3、指导并培养算法工程师团队,提升算法团队技术能力;

更新于 2025-09-09