影石感知算法工程师-数据服务方向
任职要求
1.本科或以上学历,计算机/人工智能相关专业,具备良好的英文文献检索和阅读能力 2.具有扎实的数学基础,精通多视几何、计算机视觉、机器人等基础知识 3.具有SLAM/SFM/双目深度/3DG…
工作职责
1. 负责单目/双目深度 和 3D跟踪 的真值系统方案设计、实施和数据生产 2. 负责测试数据挖掘,包括用sfm、3dgs、离线大模型等生成伪真值标签 3. 搭建benchmark系统,制定合适的测试用例、评价指标等来评价算法性能,加快算法迭代效率
VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。
VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。

关于公司 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 文远知行目前的团队既有来自谷歌、微软、亚马逊、苹果、百度、滴滴的高阶工程师,也不乏刚从顶尖高校毕业的青年才俊。来到我们当中,你会发现这是一个专业、专注、有趣、有料的队伍。大家为了一个激动人心而富有挑战的目标走到一起,互相激励、脑力碰撞,为实现产品落地、创造社会价值、推进行业技术而努力。 对有抱负的工程师,还有什么比这更有意义的呢?我们虚位以待,真诚期待技术过硬、志趣相投的小伙伴加入我们! 更多信息请访问:http://www.weride.ai,或关注官方微信号:文远知行WeRide 关于感知方向 感知是无人驾驶中非常复杂和有趣的部分之一,你构建的是一个人工智能集大成的系统,不是一项按部就班就能完成的工作!感知软件工程师负责无人驾驶感知系统的设计和实现,应对无人驾驶中各种最有挑战的问题: 1. 设计高效可靠的深度学习模型,在几十毫秒内精确检测和跟踪车周围200米之内所有的障碍物(人,车,非机动车辆,交通锥等),并对场景进行理解 2. 如何设计一般性的模型和算法去处理各式各样的长尾情况和极端环境,如路面上的垃圾袋,洒水车的水花,前车掉下来的挡板 ,如大雨,大雪,雾霾,风沙等 3. 如何保证感知模型和算法在极端的环境里的准确性和可靠性,如大雨,大雪,雾霾,风沙等 4. 把模型优化到极致,让十几个到几十个模型在车上有限的计算资源上欢快的运行 5. 如何搭建一个高效可靠的计算框架,支撑一个周期内接收几十个传感器的输入,做各种同步融合,并进行几十个深度学习模型的推理 激光雷达感知算法工程师 - 激光雷达识别和理解复杂环境(检测, 分割) - 负责激光雷达数据采集与数据处理(长尾数据, 长尾场景) - 开发高效离线工具链(C++),包括数据处理,模型训练,测试仿真等
主要从事物联网(IoT)与人工智能(AI)的跨领域技术研发,聚焦多模态感知与大模型优化在智能家居场景的深度应用,具体方向包括: 1. 多模态融合感知:研发基于视觉、语音、环境传感等多源数据的融合算法,构建高精度环境感知系统,实现对用户行为与空间状态的实时理解; 2. 垂域大模型优化:针对智能家居场景优化大模型架构,开发参数高效微调(如LoRA)与轻量化部署方案,提升模型在边缘设备端的推理效率; 3. 智能决策系统:融合多模态感知与大模型分析能力,构建个性化推荐引擎,实现设备联动自动化与场景化服务(如自适应照明、安防预警等)。 【课题名称】 基于多模态感知的IoT垂域大模型应用 【课题内容】 基于多模态感知融合技术的垂域大模型优化方案,拓展智能家居场景应用,实现环境、语音与视觉数据的协同分析与智能决策。