理想汽车舱内感知算法工程师
任职要求
1.全日制硕士及以上学历,计算机、自动化、数学、统计等相关专业 2.熟悉Linux操作系统、掌握至少一门计算机开发语言(C/C++、python等),熟悉Pytorch、Tensorflow等一种或多种神经网络计算框架,熟悉Pytorch者优先 3. 有image caption、video caption经验者优先 4.对BLIP2、LLAVA、QWEN-VL、InternVL等常见多模态算法有实际经验者优先 5.对图像分类、目标检测、图像语义分割中一项或者多项有深入理解。 6.紧跟业界前沿技术发展,有大模型、AIGC或多模态算法相关算法研发经验,有上述方向产品落地经验者优先。 7.熟悉嵌入式端视觉算法开发流程,有高通平台或者其他硬件平台算法开发、移植经验者优先。 8.对业界新技术敏感、喜欢钻研,具备熟练的英文读写能力; 有成果发表在ICCV、CVPR、NeurIPS、ICML、TPAMI等国际顶级会议、期刊者优先 ; 9.良好的逻辑和数据分析能力,Kaggle、阿里天池大赛、以及相关学术会议组织的权威比赛获奖者优先
工作职责
1.对业界前沿计算机视觉算法进行研究与探索,利用视觉机器学习算法助力理想汽车座舱深度智能化。 2.参与多模态大模型的技术研发,包括模型复现调优、算法创新、落地应用及评测 3.支持并优化当前智能座舱相关业务的视觉能力,完成视觉算法在车载硬件平台上的落地, 并持续优化算法的实时性、鲁棒性、可靠性
【岗位描述】 架构设计和工程落地计算机视觉/多模态AI系统,进行下一代驾舱一体AI系统的技术路线规划,确保团队持续产生高质量工程交付和学术预研成果。配合小鹏新一代AI芯片,实现包括但不限于舱外舱内人员与各类开集物体的检测,人体动作和行为的理解与分析,危险动作和场景的预警;车内气氛状态的感知等。 1、模型与算法系统设计:基于最先进的机器学习和神经网络方法算法,开发多模态(图像、视频、文本)模型。 2、技术路线和团队建设:结合产品需求和小鹏AI端/云规划,制定明确的工程技术演进方案和落地计划。确保团队高效运转。 3、创建训练所需的数据集;并根据模型表现以及功能需求,动态筛选、整理与适配数据。 4、实施和优化大模型的分布式训练,提高模型训练的效率和性能。 5、根据相应任务,构建合理的测试数据集,测试视觉语言模型的KPI。 6、与模型部署团队进行沟通,协助模型的转化和部署。 7、实时跟进学术界前沿算法,升级改进数据生成算法与软件。 8、跨团队跨部门沟通协作。

1. 从事视觉SFM/SLAM等前沿算法研究和设计,负责单目/多目摄像头的3D重建算法的前沿技术研发; 2. 负责智能车舱产品3D目标感知,负责车舱内DMS/OMS算法研发和模型优化工作; 3. 负责跟踪最前沿3D技术研发,负责3D感知与多模态大模型融合的研发工作;
负责车载场景下舱内外图像感知相关的算法工作,包括但不限于目标检测、关键点识别、视频动作识别、图像/视频描述生成等算法,同时负责算法和模型的落地应用,解决实际业务问题。
* 研究智能座舱显示技术趋势,制定车载显示产品技术路线图,定义差异化创新功能。 * 主导座舱显示系统的硬件选型、光学设计及人机交互评估,平衡性能、成本与车规级可靠性。 * 联合集团内部团队开发新型显示模组,推动解决产品工程化难点。 * 深度对接主机厂座舱显示需求,输出技术方案、含BOM成本测算,参与客户需求评审及定制化开发。 * 协同销售团队完成产品技术提案(RFQ响应)、定点谈判及量产交付,支持年营收目标达成。 * 拓展AR/VR/PHUD、光学膜材等相关产业链资源,探索舱内全景显示、光场显示等下一代技术预研。 * 推动显示系统与座舱域控、舱内外感知等方向的融合创新。