
文远知行数据处理平台负责人
任职要求
公司介绍: 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 文远知行目前的团队既有来自谷歌、微软、亚马逊、苹果、百度、滴滴的高阶工程师,也不乏刚从顶尖高校毕业的青年才俊。来到我们当中,你会发现这是一个专业、专注、有趣、有料的队伍。大家为了一个激动人心而富有挑战的目标走到一起,互相激励、脑力碰撞,为实现产品落地、创造社会价值、推进行业技术而努力。 对有抱负的工程师,还有什么比这更有意义的呢?我们虚位以待,真诚期待技术过硬、志趣相投的小伙伴加入我们! 更多信息请访问:http://www.weride.ai,或关注官方微信号:文远知行WeRide Infra介绍 基础架构团队为车端提供高可用、高性能和高可靠的车载系统,以及灵活的系统应用接口;离线工具链提供各类高效的开发集成平台和仿真平台,通过收集和分析自动驾驶过程中的海量数据,设计和执行大规模仿真任务,提供强大的工具帮助算法团队快速定位问题和解决问题。 基础架构团队负责设计和开发自研车载系统及中间件、开发高性能云计算系统、搭建大规模数据…
工作职责
无
1. 负责语料数据处理工程架构的整体设计与演进,覆盖文本、图片、音视频等多模态语料的清洗、处理、与交付,支撑千问app toC业务场景的高质量语料供给; 2. 负责语料数据处理体系的架构设计与能力建设,基于对模型训练需求与语料特性的理解,设计标准化的数据处理算子与Pipeline体系(如清洗、去重、过滤、结构化、对齐、质量评估等),与基础调度及AI Infra团队协同,实现大规模语料数据处理的效率提升与成本优化; 3. 构建语料数据管控、数据画像与数据资产管理能力,对语料数据的来源、结构、分布、质量、覆盖度及使用效果进行系统化刻画,实现语料数据的可管理、可理解、可追溯,为模型训练与业务优化提供数据洞察与决策支持; 4. 打造语料数据质量评估平台,支持多模态语料数据质量分析,沉淀高质量语料数据资产,并通过AI能力显著提升语料生产效率与质量; 5. 构建语料数据分析与效果归因能力,打通“语料数据—模型训练—业务效果”的反馈链路,通过数据分析识别关键数据问题与数据缺口,指导语料数据采集、处理与标注策略,形成持续优化的数据飞轮; 6. 作为工程架构负责人,统筹语料数据处理相关技术方向与系统演进,带领团队完成关键系统建设,并与算法、业务及AI基础平台团队协同,推动语料数据体系在各类AI场景中的落地。

1. 负责语料数据处理工程架构的整体设计与演进,覆盖文本、图片、音视频等多模态语料的清洗、处理、与交付,支撑千问app toC业务场景的高质量语料供给; 2. 负责语料数据处理体系的架构设计与能力建设,基于对模型训练需求与语料特性的理解,设计标准化的数据处理算子与Pipeline体系(如清洗、去重、过滤、结构化、对齐、质量评估等),与基础调度及AI Infra团队协同,实现大规模语料数据处理的效率提升与成本优化; 3. 构建语料数据管控、数据画像与数据资产管理能力,对语料数据的来源、结构、分布、质量、覆盖度及使用效果进行系统化刻画,实现语料数据的可管理、可理解、可追溯,为模型训练与业务优化提供数据洞察与决策支持; 4. 打造语料数据质量评估平台,支持多模态语料数据质量分析,沉淀高质量语料数据资产,并通过AI能力显著提升语料生产效率与质量; 5. 构建语料数据分析与效果归因能力,打通“语料数据—模型训练—业务效果”的反馈链路,通过数据分析识别关键数据问题与数据缺口,指导语料数据采集、处理与标注策略,形成持续优化的数据飞轮; 6. 作为工程架构负责人,统筹语料数据处理相关技术方向与系统演进,带领团队完成关键系统建设,并与算法、业务及AI基础平台团队协同,推动语料数据体系在各类AI场景中的落地。
岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力

岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力