小米云端大模型实习生
任职要求
1、扎实的C++或Python语言知识及熟练运用, 扎实的数据结构与算法知识; 2、在自动驾驶相关的感知算法(包括BEV感知,3D Detection/Segmentation,Occupancy Network,多传感器融合,单目/多目深度估计,三维重建)中的一个或多个领域有过科研经历; 3、计算机,数学,机器学习,机器人,自动驾驶或相关专业优先; 4、优秀的沟通、学习及自我驱动能力,出色的团队合作意识; 5、具备学术论文、优秀开源项目、高水平竞赛获奖者优先。
工作职责
1、探索自动驾驶云端大模型算法研发和优化,包括但不限于4D真值自动化标注、场景理解等方向; 2、探索云端视觉大模型的前沿算法与应用,包括但不限于depth/semantic/flow等方向 3、探索基于海量量产数据,研发无监督/自监督算法,持续探索大模型的语义理解能力和空间感知能力;
1、探索自动驾驶云端大模型算法研发和优化,包括但不限于4D真值自动化标注、场景理解等方向; 2、探索云端视觉大模型的前沿算法与应用,包括但不限于depth/semantic/flow等方向 3、探索基于海量量产数据,研发无监督/自监督算法,持续探索大模型的语义理解能力和空间感知能力;
1、负责数据驱动的云端大模型算法研发和优化,研发场景与标签的生成式算法技术,探索视觉/点云基座大模型的前沿算法与应用,包括但不限于depth/semantic/flow等方向 2、基于海量量产数据,研发无监督/自监督算法,持续探索大模型的语义理解能力和空间感知能力;
-负责设计和研发感知车端模型/云端大模型所需数据的自动标注算法,提升离线算法标注的质量和推理效率 -负责设计和研发感知车端模型/云端大模型所需数据的半自动标注算法,提升人机交互标注的质量和效率 -标注任务包括但不限于:点云检测/识别/分割、图像检测/识别/分割等 -配合上下游完成其它方向工作内容

1. 车端与云端数据流水线构建:设计并开发车端轻量化数据筛选与触发器,制定数据采集策略,确保高效回收有价值场景;构建与优化云端大规模数据自动化处理流水线,包括清洗、送标和评测,支持模型的持续迭代。 2. 自动化数据挖掘与标注:利用基于规则和基于VLM大模型的方法,对海量驾驶场景进行自动化、智能化的挖掘与标签生成。针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等。 3. 云端大模型: - 跟踪最新的AI进展,在公司自有数据集上完成适配验证,完成AI模型选型。 - 参与或主导多模态视觉语言大模型的微调、优化与云端部署,使其适用于robotaxi场景的用户行为监测和车端Corner Case的远程决策支持(如生成避让、绕行指令)。