
文远知行标注算法工程师
社招全职地点:广州状态:招聘
任职要求
计算机、电子、自动化、应用数学等相关专业硕士或以上学历; 具有良好的机器学习和深度学习的理论基础,良好的数学基础以及分析解决问题的能力; 具备扎实的Python/C++开发能力,有良好的编程习惯; 对激光雷达/图像/融合的目标检测、目标跟踪、三维重建、视频分析、NLP等技术中的至少1个有深入的科研、研发经验; 具有良好的沟通能力,良好的团队合作精神,良好的科研精神; 加分项:具有自动驾驶感知算法研发经验优先; 加分项:有多大模型微调、主动学习、强化学习研发经验优先。
工作职责
公司介绍: 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 Data团队介绍: 在无人车等行业中,数据的重要性不言而喻,尤其是当模型越来越大,甚至算法建模流程逐渐从data-driven向data-centric转变的趋势下,对数据的处理越来越被重视。 数据组的是打通自动驾驶数据闭环链路,包括数据采集、数据索引、数据挖掘、数据标注、模型训练等多个方面,打造一个完整的闭环,加快自动驾驶算法的迭代速度。同时,数据组也开发了多个数据分析和处理的工具链,全方位打造企业级的大数据平台。 自动化标注组介绍: 在数据处理中,数据标注是重要一环,我们希望在传统人工标注中加入更多智能,更多地让模型来自动、半自动地完成数据标注,以解决人工标注中的成本、效率和数据质量等问题,有力地“赋能”业务。 与具体业务中的模型开发不同,标注阶段有更加充足的计算资源、有更加丰富的数据,可以选择更大更新的模型(包括大模型),同时还有人类在环(Human-in-the-loop) -- 这些独有的特点非常有意思,更重要地,它们也是自动化标注这件事可以成立的重要原因。 工作职责: 我们正在寻找一位自动化标注工程师,负责设计和开发自动驾驶数据自动化和半自动化标注算法,并与标注工具开发团队协作,研发标注工具优化方案,核心职责包括: 设计和开发自动驾驶数据自动化和半自动化标注算法,提高标注效率和准确性,包括但不限于:点云检测/识别/分割、图像检测/识别/分割等; 与标注工具开发团队协作,研发标注工具优化方案,提高标注工具的易用性和功能性; 研究和探索新的自动化标注技术和算法,不断提升数据标注的效率和准确性。
包括英文材料
学历+
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
相关职位
社招3-5年IDG
-负责设计和研发全自动标注算法,提升感知车端/云端模型所需数据的标注自动化比例 -负责设计和研发半自动交互标注算法,提升感知车端/云端模型所需数据人工标注的效率 -负责设计和研发标注质检算法,提升感知标注数据的质量 -负责优化标注数据生产框架,提升数据生产在大规模计算资源上的运行效率 -标注任务包括但不限于:点云检测/识别/分割、图像检测/识别/分割等
更新于 2024-06-20

社招3年以上算法
1、自动化标注大模型研发:面向自动驾驶感知与规控任务(如障碍物、车道线、红绿灯、OCC等),设计与训练自动化/半自动化标注大模型,实现基于点云或图像的检测、跟踪、分割、融合等核心能力。 2、多模态融合与模型优化:基于相机、LiDAR、GNSS、IMU、轮速计等多源数据,构建多模态特征融合与生成模型,持续提升 4D 感知场景下的检出率、精度与鲁棒性。 3、自动化标注的Dag流程设计:负责将自动化标注链路拆解为可复用算子节点(operator),明确各节点输入输出、功能与依赖关系,保障器高效稳定执行; 4、数据闭环与持续学习:与数据挖掘、质量评估、模型训练、验证环节紧密协同,构建模型驱动的数据闭环体系,不断提升自动标注效率、准确率与泛化能力。 5、技术探索与落地:关注 AIGC、生成式标注、主动学习、弱监督、LLM+视觉理解等前沿方向,并推动其在自动标注任务中的应用落地
更新于 2025-10-17