
Momenta数据闭环工程师 - Data Infra
任职要求
1、本科及以上学历,计算机科学、软件工程、自动化等相关专业,3 年以上数据闭环或相关领域工作经验 2、有以下工作经验之一即可: a、熟悉自动驾驶数据闭环全流程,在车端影子模式部署、高价值数据筛选方面有实际项目经验 b、具备云端自动化数据挖掘系统开发经验,熟练使用 Python、C++ 等编程语言,掌握 SQL 与数据处理工具 c、熟悉至少一种自动标注技术(如基于预训练模型的半监督标注、多传感器融合标注等),有实际落地案例者优先 3、了解大模型算法(如transformer,VLM等)基本原理,能理解算法需求并转化为数据解决方案 4、具备良好的问题分析与解决能力,能从复杂数据中发现规律并提出优化策略 5、有大规模数据处理、分布式计算经验者优先,熟悉 Spark、Flink 等大数据框架者优先 6、具有良好的沟通能力与团队协作精神,能在快节奏环境下高效推进工作
工作职责
1、负责自动驾驶数据闭环核心系统的设计与开发,构建从车端数据采集到云端模型迭代的全链路自动化体系 2、优化车端影子模式(Shadow Mode)系统,设计高效的触发式数据采集策略,精准捕获有价值的 Hard Event 数据 3、开发智能数据筛选器(Filter),通过规则引擎与 AI 模型相结合的方式,从海量路测数据中高效筛选高价值训练样本 4、搭建云端自动化数据挖掘平台,实现异常场景、算法失效案例的自动发现与聚类分析 5、推动自动标注系统的迭代优化,自动化评估驾驶行为质量,自动化清洗坏行为数据,提升标注效率与质量 6、与EBM团队深度协作,将数据闭环产出转化为模型性能的持续提升 7、构建数据质量评估体系,确保训练数据的准确性、多样性与代表性
1.基于公司海量业务数据 构建系统性分析框架 2.运用数据挖掘技术识别问题,定位异常数据模式,输出可落地的改进建议 3.开发自动化数据分析工具与可视化系统,提升数据洞察效率 4.构建预测模型与诊断模型,支持业务决策智能化转型

工作职责 1. 负责ADAS、城区/高速NOA场景下的感知算法研发和数据闭环,包含模型真值生成链路、数据集构建、数据分析、数据挖掘、数据质检、指标看板等; 2. 掌握数据挖掘、标注、训练、部署及badcase回归等闭环链路,并伴随业务开展持续优化;掌握通过数据闭环持续迭代模型的能力; 3. 探索使用data balance, 数据蒸馏等方法支持端侧和云上模型的可持续开发,同时针对特定场景构建特定数据集生产和算法回归评测工作; 4. 支持模型训练/回归/评测/CICD等自动化链路的开发和维护

公司介绍: 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 Data团队介绍: 在无人车等行业中,数据的重要性不言而喻,尤其是当模型越来越大,甚至算法建模流程逐渐从data-driven向data-centric转变的趋势下,对数据的处理越来越被重视。 数据组的是打通自动驾驶数据闭环链路,包括数据采集、数据索引、数据挖掘、数据标注、模型训练等多个方面,打造一个完整的闭环,加快自动驾驶算法的迭代速度。同时,数据组也开发了多个数据分析和处理的工具链,全方位打造企业级的大数据平台。 自动化标注组介绍: 在数据处理中,数据标注是重要一环,我们希望在传统人工标注中加入更多智能,更多地让模型来自动、半自动地完成数据标注,以解决人工标注中的成本、效率和数据质量等问题,有力地“赋能”业务。 与具体业务中的模型开发不同,标注阶段有更加充足的计算资源、有更加丰富的数据,可以选择更大更新的模型(包括大模型),同时还有人类在环(Human-in-the-loop) -- 这些独有的特点非常有意思,更重要地,它们也是自动化标注这件事可以成立的重要原因。 工作职责: 我们正在寻找一位自动化标注工程师,负责设计和开发自动驾驶数据自动化和半自动化标注算法,并与标注工具开发团队协作,研发标注工具优化方案,核心职责包括: 设计和开发自动驾驶数据自动化和半自动化标注算法,提高标注效率和准确性,包括但不限于:点云检测/识别/分割、图像检测/识别/分割等; 与标注工具开发团队协作,研发标注工具优化方案,提高标注工具的易用性和功能性; 研究和探索新的自动化标注技术和算法,不断提升数据标注的效率和准确性。

公司介绍: 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 文远知行目前的团队既有来自谷歌、微软、亚马逊、苹果、百度、滴滴的高阶工程师,也不乏刚从顶尖高校毕业的青年才俊。来到我们当中,你会发现这是一个专业、专注、有趣、有料的队伍。大家为了一个激动人心而富有挑战的目标走到一起,互相激励、脑力碰撞,为实现产品落地、创造社会价值、推进行业技术而努力。对有抱负的工程师,还有什么比这更有意义的呢?我们虚位以待,真诚期待技术过硬、志趣相投的小伙伴加入我们! 更多信息请访问:http://www.weride.ai,或关注官方微信号:文远知行WeRide Data团队介绍: “数据团队可以说是自动驾驶系统的血液,给自动驾驶各个模块提供养分,同时将它们紧密结合在一起。” 数据组的是打通自动驾驶数据闭环链路,包括数据采集、数据上传、数据平台搭建、数据索引、数据标注、模型训练等多个方面,打造一个完整的闭环,加快自动驾驶算法的迭代速度。同时,数据组也开发了多个数据分析和处理的工具链,全方位打造企业级的大数据平台。 岗位职责: 独立完成公司标注应用服务相关开发工作 确定接口协议,独立完成接口文档的编写并组织评审 深入解析代码, 提升代码执行效率, 加强代码兼容性 深入了解产品经理业务需求,能把业务需求转化为可落地研发技术方案