菜鸟计算机视觉算法工程师(自动驾驶)
任职要求
1、极佳的工程实现能力,熟练掌握C/C++、Java、Python等至少一门语言 ,ACM/ICPC、topcoder等编程比赛获奖者优先; 2、良好的科研能力,有成果发表在ICCV、CVPR、NeurIPS、ICML、TPAMI等国际顶级会议、期刊者优先; 3、良好的逻辑和数据分析能力,Kaggle、阿里天池大赛、以及相关学术会议组织的权威比赛获奖者优先; 4、熟悉计算机视觉、机器学习、图像/视频分析与处理等相关领域技术和应用,有大量实践经验者优先。 5、学习能力强,对新事物有好奇心,并能快速适应新环境; 6、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标; 7、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。
工作职责
自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。
1. 构建支持多感知任务的视觉主干模型(ViT/ConvNeXt 变体),支持BEV与多视角输入; 2. 研究多任务感知结构的共享编码器与分离解码器设计,提升特征共享能力与下游性能; 3. 研究多任务联合训练策略与自监督学习机制,如World model、Masked Modeling、contrastive alignment、BEV pretrain; 4. 在Occupancy、Occ Flow、Depth等方向构建高质量训练集,支持无标签预训练与有限标签适配。 【课题名称】 视觉Foundation Model 【课题内容】 研究构建统一、可泛化、可压缩的视觉感知基础模型,以支持多种下游自动驾驶任务(Depth、Semantic、Optical Flow、Occupancy、Occupancy Flow)同时学习并共享表征。该方向侧重视觉模态自监督学习,通过MAE/diffusion等手段构建可迁移感知主干,具备跨任务迁移、零样本适配能力,显著提升感知系统的通用性与数据效率。
1. 构建支持多感知任务的视觉主干模型(ViT/ConvNeXt 变体),支持BEV与多视角输入; 2. 研究多任务感知结构的共享编码器与分离解码器设计,提升特征共享能力与下游性能; 3. 研究多任务联合训练策略与自监督学习机制,如World model、Masked Modeling、contrastive alignment、BEV pretrain; 4. 在Occupancy、Occ Flow、Depth等方向构建高质量训练集,支持无标签预训练与有限标签适配。 【课题名称】 视觉Foundation Model 【课题内容】 研究构建统一、可泛化、可压缩的视觉感知基础模型,以支持多种下游自动驾驶任务(Depth、Semantic、Optical Flow、Occupancy、Occupancy Flow)同时学习并共享表征。该方向侧重视觉模态自监督学习,通过MAE/diffusion等手段构建可迁移感知主干,具备跨任务迁移、零样本适配能力,显著提升感知系统的通用性与数据效率。
-负责计算机视觉相关深度学习算法研发,系统及产品落地工作 -研发方向包括但不限于:目标检测,多目标跟踪/运动估计,道路结构感知,交通信号识别等 -负责相关视觉算法系统优化,实现产品快速迭代,满足业务产品需求 -处理大规模数据集,进行数据清洗、特征提取、模型训练和评估,优化算法的性能和效果