
哈啰智驾数据实习生-【自动驾驶】
任职要求
1. 学历与专业:本科及以上学历,计算机、软件工程、自动化、电子工程、人工智能、数学等相关理工科专业; 2. 技术基础:熟悉linux及C++编程,对基础的计算机原理、数据结构、操作系统等比较熟悉; 3. 模型与数据经验: - 有实际的数据处理、挖掘或分析经验,熟悉数据标注、清洗、增强等相关流程和方法; - 对大模型有深入理解,熟悉视觉语言模型(VLM)、大语言模型(LLM)的基本原理和应用有浓厚兴趣或实践经验。; 4. 自动驾驶知识:对自动驾驶技术栈(感知、预测、规划)有基本了解,熟悉nuScenes、Waymo等至少一个主流自动驾驶数据集; 5. 个人素质:具备优秀的问题分析能力和解决复杂问题的热情,工作踏实靠谱,拥有良好的团队协作精神和跨团队沟通能力,表现优异者可转正; 6. 加分项: - 在Kaggle、天池等人工智能竞赛中取得过优异成绩,或在权威开源数据集榜单上排名靠前; - 有多模态学习、大模型提示词工程(Prompt Engineering)、智能体(Agent)设计应用或链式思考(CoT)等相关经验。
工作职责
1. 车端与云端数据流水线构建:设计并开发车端轻量化数据筛选与触发器,制定数据采集策略,确保高效回收有价值场景;构建与优化云端大规模数据自动化处理流水线,包括清洗、送标和评测,支持模型的持续迭代; 2. 自动化数据挖掘与标注:利用基于规则和基于VLM大模型的方法,对海量驾驶场景进行自动化、智能化的挖掘与标签生成。针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等; 3. 云端大模型: - 跟踪最新的AI进展,在公司自有数据集上完成适配验证,完成AI模型选型; - 参与或主导多模态视觉语言大模型的微调、优化与云端部署,使其适用于robotaxi场景的用户行为监测和车端Corner Case的远程决策支持(如生成避让、绕行指令)。

1. 车端与云端数据流水线构建:设计并开发车端轻量化数据筛选与触发器,制定数据采集策略,确保高效回收有价值场景;构建与优化云端大规模数据自动化处理流水线,包括清洗、送标和评测,支持模型的持续迭代。 2. 自动化数据挖掘与标注:利用基于规则和基于VLM大模型的方法,对海量驾驶场景进行自动化、智能化的挖掘与标签生成。针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等。 3. 云端大模型: - 跟踪最新的AI进展,在公司自有数据集上完成适配验证,完成AI模型选型。 - 参与或主导多模态视觉语言大模型的微调、优化与云端部署,使其适用于robotaxi场景的用户行为监测和车端Corner Case的远程决策支持(如生成避让、绕行指令)。
数据分析实习生(自动驾驶方向) 【base】广州/上海,本科100/天,硕士150/天 1、自动驾驶性能分析 - 通过自动驾驶系统运行数据,分析智驾性能问题,评估自动驾驶技术迭代效果; 2、 用户增长与使用率分析 - 分析用户使用自动驾驶功能的行为路径,识别增长关键节点; - 通过归因模型量化行为、活动、产品改版对使用率的影响,输出分析报告; 3、数据可视化及自动化搭建 - 使用Hive/Postgre SQL处理PB级数据,搭建BI仪表盘(如Tableau/Power BI); - 协助整理各分析报告提效优化需求并完成跟进(跟进数仓与前端与自动化相关任务及进度); - 协助梳理底层数据建设的稳定性与可拓展性(对接相关方完成数据基础建设及数据管理优化);

1. 协助研发基于强化学习(RL)或模仿学习(IL)的自动驾驶决策规划算法,解决复杂交通场景下的车辆行为决策与运动规划问题; 2. 参与构建和优化用于训练决策模型的数据处理流程,包括特征工程、场景提取、奖励函数设计及大规模数据集处理; 3. 负责或参与相关算法的仿真测试、实车调试、性能评估与迭代优化,推动算法在真实环境中的性能提升和落地; 4. 跟踪并调研强化学习、模仿学习、行为预测等领域的国际前沿动态与最新研究成果(如顶会论文CVPR, ICRA, NeurIPS, ICML等),并尝试将其应用于实际项目; 5. 协助端到端自动驾驶大模型或相关子模块的研发与优化工作。