logo of horizon

地平线视觉深度学习算法实习生(VLA静态要素理解方向)

实习兼职算法序列地点:北京 | 上海状态:招聘

任职要求


1、计算机视觉模式识别机器学习、电子信息、机器人等相关专业的硕士/博士在读;
2、熟悉主流深度学习算法,精通一/多个领域,包括但不限于目标检测、分割、跟踪、多任务学习、立体视觉等领域,有计算机视觉模式识别领域顶会;(CVPR/ICCV/ECCV/ICML/NeurIPS)或顶刊(TPAMI/IJCV/TIP)作品者优先;顶级学术比赛获奖者或实际工程项目经验者优先;
3、掌握一种以上的深度学习训练框架(Pytorch, MXNet, Tensorflow…);
4、深入了解数据结构算法、代码优化和大规模数据处理等相关知识;
5、精通 C/C++Python 编程,有ACM经验者优先
6、每周实习时间至少3天,实习时长至少3个月

工作地点:上海张江/北京

工作职责


1、探索vla模型在复杂路口的场景理解能力以及对下游决策模块的提升;
2、负责核心算法或模型的原创设计以及工程化落地,如模型优化、评测体系化构建、case迭代等;
3、掌握数据挖掘、标注、训练、部署及badcase回归等闭环链路,并伴随业务开展持续优化;
4、掌握通过数据闭环持续迭代模型的能力;
包括英文材料
OpenCV+
模式识别+
机器学习+
深度学习+
算法+
CVPR+
ICCV+
ECCV+
ICML+
NeurIPS+
PyTorch+
MXNet+
TensorFlow+
数据结构+
C+
C+++
Python+
相关职位

logo of liauto
实习算法与软件

1.负责理想汽车VLA模型方法研发和工程落地,包括但不限于视觉多模态理解、高级指令拆解及多模态policy预测; 2.负责设计高性能上限,具备量产能力的VLA模型算法,对包括但不限于diffusion、VLM等模型算法有实操经验; 3.开发高效离线训练框架,以及可实时运行的在线推理框架,优化模型推理性能,研发模型部署工具链和优化工具; 4.建立云端数据感知/决策联合标注Pipeline、数据挖掘机制以及难样本分析等工具链,通过数据闭环持续选代模型能力。

logo of nio
实习算法

1. 研究和开发先进的机器学习算法, 应用于智能辅助驾驶的各个领域,包括但不限于: - 端到端大模型 (VLA、世界模型等) - 环境感知 (目标检测、语义分割、多传感器融合等) - 决策规划 (路径规划、行为预测、运动控制等) 2. 探索和实现前沿的人工智能技术, 如深度学习、强化学习、计算机视觉、自然语言处理等,以提升智能辅助驾驶系统的性能、安全性和可靠性。 3. 设计和开发大规模数据集, 用于训练和评估智能辅助驾驶算法。

更新于 2025-07-02
logo of mi
实习

1. 针对辅助驾驶的各个场景,协助进行VLM/VLA模型的prompt优化 2. 对于VLM/VLA表现不佳的场景,能够参与到实际项目中,配合并协助做数据收集和处理工作 3. 参与VLM/VLA模型优化方面的工作 4. 对前沿技术感兴趣,能够阅读相关领域文献,保持对前沿技术的敏感性

更新于 2025-08-12
logo of mi
实习

自动驾驶场景下多模态大模型(VLA:Vision-Language-Action)算法的预研, 包含但不限于: 1. 研究视觉、语言与行为动作之间的联合建模机制,探索多模态预训练与表征学习方法,实现跨模态对齐与融合; 2. 多模态数据集的构建与管理,包括视觉、语言、行为等多模态标签设计与质量控制; 3. 探索模型蒸馏、小样本泛化等技术,推动模型在自动驾驶复杂场景中的部署效率; 4. 跟进并复现前沿研究(如 EMMA、RT-2、OpenVLA等),协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术,提升多模态模型的响应能力与行为决策能力; 6. 撰写高质量的技术文档,参与论文发表或专利申请。

更新于 2025-04-01