蔚来校招-机器人感知算法开发工程师(分割与姿态估计方向)
任职要求
1.硕士及以上学历,计算机、自动化、机器人、人工智能、电子工程等相关专业; 2.熟练掌握以下至少一类技术: 图像分割/视频分割 (Mask R-CNN, MaskFormer, SAM2 等) 三维点云处理与建图(PCL、Open3D、OctoMap等) 姿态估计 (FFHBM, CosyPose, FFB6D等) 3.熟悉常用的深度学习框架(如 PyTorch / TensorFlow),具备一定的模型训练与调优经验; 4.掌握 ROS / ROS2 开发、TF 坐标系管理、RViz 可视化工具; 5.熟悉常见相机标定、多传感器时间同步、坐标转换等; 6.有 C++/Python 编程经验,具备良好的工程实现能力和代码规范意识; 7.具备良好的沟通能力与团队协作意识,能主动推动项目落地。 【加分项】 1.有 Jetson / Orin / FPGA 等边缘平台部署经验; 2.有智能辅助驾驶、机器人实习经历者优先; 3.有CVPR等视觉方面顶会论文发表、开源项目贡献者优先。
工作职责
1.负责机器人感知模块的算法设计与实现,包括但不限于: 视频分割 多视图3D重建与稠密地图构建 6D位姿估计 2.结合双目/RGB-D/单目相机,进行深度感知与三维信息提取; 3获取多传感器数据,camera、Lidar、IMU等进行多传感器融合, 实现协同感知。 4.参与构建数据采集、标注、训练与评估全流程系统; 5.与硬件算法加速工程师一起推动感知算法的工程落地与部署等; 6.配合机器人控制、规划、抓取等模块,提供稳定的视觉感知输出。 7.跟踪并复现相关学术论文算法(如 FFHBM, CosyPose, FFB6D 等)并进行精度/性能测试。

1、负责结合深度学习的自动驾驶场景中Depth/光流/SFM等方向的3D视觉算法研发 2、负责Camera/Lidar/Radar多传感器融合的3D视觉算法研究与开发 3、开展基于AI芯片平台的3D视觉算法原型方案设计及性能优化 4、参与驾驶环境感知前沿算法的研发,包括目标检测、语义分割、目标跟踪等技术实现 5、探索自动驾驶多传感器融合感知算法的技术路径并进行工程化落地 6、基于Software 2.0和数据闭环理念构建感知算法系统 7、针对AI芯片平台开展计算机视觉任务的模型结构创新、实现与优化 8、研究并优化自动驾驶场景中的感知网络模型,提升算法效能 9、持续跟进计算机视觉领域的前沿技术,推动关键技术创新应用
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
职位概述: 我们寻找一位智能传感器开发工程师,为机器人在复杂环境(如导航、抓取操作、人机交互)中设计创新的感知方案。负责多传感器(视觉、触觉、IMU、RTK等)与算法的深度融合,开发高可靠性感知系统,并推动机器人平台的落地应用。该职位需兼具硬件设计、算法优化及工程实现能力。 1. 传感器系统方案设计:分析机器人需求,定义传感功能及技术指标,完成关键技术预研与可行性评估。 2. 传感器设计与优化:主导视觉、雷达、触觉等传感器的仿真设计、选型及性能优化。 3. 系统验证与交付:制定硬件与算法测试方案,验证仿真/真实场景性能,确保产品交付。 4. 软硬件协同优化:集成传感器与算法,提升系统在动态环境中的实时性与稳定性。 5. 多传感器融合算法开发:设计并优化视觉/IMU/触觉等数据融合算法,增强环境感知能力。 6. 跨团队协作:与算法、硬件、系统团队协同,确保传感器与机器人平台无缝对接。 7. 前沿技术探索:研究新型传感器技术及机器学习模型,推动感知系统创新。