百度自动驾驶数据闭环高级后端工程师(J94282)
任职要求
-2年及以上经验,本科及以上学历 -熟练的python语言技能,熟悉shell命令及开发,掌握python/c++/go其中一门语言,对多线程、异步、大数据、高并发等系统有独立设计经验,扎实的计算机科学基础,拥有缓存、消息队列,关系数据库,nosql,操作系统,网络协议等相关知识,并对其中任一项具备深入的理解和认识 -熟悉分布式计算相关技术,熟悉hadoop、spark、storm等系统原理和适用场景,并拥有集群设计和SRE经验,具备服务网格,大规模微服务集群及服务治理,监控系统相关工作经验 -掌握分布式存储系统,对elasticsearch、mongodb、hdfs的原理熟悉,并有PB级大规模高可用集群设计和运维经验。了解OLAP系统的特点 -学习能力强,有良好的逻辑思维能力、具备同质化问题的归纳和抽象能力,专注技术并追求最佳实践。强烈的责任心,并拥有良好的沟通与合作能力 -加分项:汽车技术相关背景,熟练的道路驾驶技能,汽车运动相关理论知识,机器学习/深度学习相关背景,机器人技术相关背景
工作职责
-负责自动驾驶数据全链路数据流构建,完成数据闭环下的AI Infra系统构建,包含挖掘相关框架、标注、数据管道、分布式训练、模型评测、推理和部署全链路的建设 -负责数据闭环系统稳定性和效率建设,对数据飞轮落地有想法和落地路径 -负责面向AI Infra 的数据存储系统建设,了解高吞吐下的Infra 框架设计 -负责面向大模型时代的工程架构优化工作,对各业务进行对接和合理化评估,针对现行系统中各种问题进行分析优化,给出设计优化方案并实现
1.负责自动标注算法研发,实现多模态数据的联合生成与标注,涉及算法有点云分割&检测/动静态BEV/OCC/VLM等,支撑端到端/VLA项目落地; 2.负责云端VLM/VLA算法研发,并落地车云端; 3.负责重建生成算法在自动驾驶场景的研发,应用于静态标注和数据合成业务中; 4.探索新的模型训练方式在自动驾驶场景的落地,包括自监督/弱监督/增量训练/强化学习/数据配比方案等。 5.跟踪最新的大模型和人工智能发展动态,持续迭代更新多模态大模型方案; 6.主导关键技术的专利撰写和论文发表工作。

工作地点:上海、广州、北京 团队目标: 我们致力于构建世界一流的自动驾驶数据闭环体系。您将成为团队中的“数据科学家”与“价值度量官”,通过深度洞察和数据驱动,量化数据闭环各环节的效能与质量,确保我们交付的每一份数据都能高效、精准地驱动算法进化,成为公司核心竞争力的基石。 1、数据闭环效能度量体系设计: 构建并持续优化数据从“采集需求提出”到“算法消费”的全链路核心指标体系。 设计科学、可量化的指标,如:端到端交付周期、数据质量有效率、场景覆盖度、数据利用率、算法迭代收益关联度等。 深入业务,理解算法迭代流程,建立数据服务对算法效能提升的价值归因模型。 2、深度洞察与根因分析: 基于指标体系,主动发现数据闭环中的效率瓶颈、质量洼地与资源浪费。 运用统计学方法和数据分析工具,进行深度根因分析。例如:交付延迟是源于采集困难、标注堆积,还是需求变更?质量下降是特定场景、特定供应商还是标注标准模糊导致? 对数据的真实性和有效性具有敏锐的洞察力,能识别并排查数据异常、逻辑错误及潜在的“数据造假”行为。 3、数据产品与看板驱动决策: 主导开发和维护直观、实时的数据驾驶舱与可视化看板,为TPM、运营、执行及管理层提供决策支持。 将分析结论产品化,推动建立自动化监控预警机制(如:交付周期超时预警、质量波动预警)。 4、驱动业务优化: 与数据策略、运营、执行团队紧密协作,将数据分析结论转化为具体的流程优化建议、资源调配方案和质量改进措施。 通过数据反馈,驱动采集策略、标注标准、工具链的持续迭代。
自动驾驶视觉算法高级/资深工程师(占据网络) 1、车载视觉感知算法以及端到端算法方向,用于车端高阶辅助驾驶功能。 2、侧重视觉BEVNet以及Lidar感知,包含但不限于检测、分割、深度估计等任务。 3、负责障碍物感知模型车端交付。 4、负责障碍物感知用户车数据闭环,大模型数据挖掘,视觉3D重建Autolabel。 5、负责自驾感知Foundation Model,World Model E2E仿真和数据生成。