
哈啰视觉算法工程师-A项目

职位名称: 职位描述(JD): 我们正在寻找一位富有激情和创新精神的图像算法工程师,加入我们充满活力的团队。作为图像算法工程师,你将负责研发和优化图像处理算法,并致力于将最新技术应用于我们的产品中。 岗位职责 1、研发视觉算法,与各类技术专家共同探索计算机视觉、AIGC、多模态、人工智能等前沿技术,并推动其在业务中的应用,实现业务增长。 2、根据业务场景,设计并预先研究简洁的技术方案。 3、负责图像生成、智能编辑算法相关产品的研发,如图像矫正、图像高清增强、图像美化/去噪/修复、图像文本识别等,涉及的技术包括但不限于图像检测、识别分割、超分、合成、多模态等。 4、负责算法的研发、实施及效果优化,解决算法在实际应用中可能遇到的优化问题,包括模型加速、压缩及效果提升等,确保CV算法成功应用于实际场景中。 5、积极研究前沿计算机视觉技术,结合公司未来业务需求,开发领先算法,短期实现技术突破并长期对公司业务产生积极影响。
数据算法团队在特斯拉工业智能研发方面扮演关键角色。我们通过自主搭建数据算法平台,赋能生产制造、供应链、销售、服务和充电网络等领域,将信息转化为高价值的数据资产,从而创造更优质的产品并提供完美的用户体验。 作为特斯拉应用软件团队的数据算法工程师,您将参与自研数据算法产品和项目的全生命周期,从孵化到落地,从雏形到成熟。您将领导数据的收集、清理、预处理、模型训练以及生产部署的全流程。理想候选人应对人工智能和3D视觉技术充满热情,并紧跟该领域的最新进展。 本职位主要聚焦于工厂相关的3D机器视觉应用,包括自动视觉质检、机器人引导、视觉尺寸测量(如精确尺寸验证、公差检查和3D形状分析)、物体姿态估计以及工业自动化场景中的点云处理和实时感知。 岗位职责 机器协同控制相关:负责相机标定、手眼标定、点云数据处理(如滤波、分割、检测、配准和6D位姿估计),配合机器人/PLC等技术,驱动3D视觉应用与生产协同。主动开展机器人控制和引导,促进生产制造效率。 3D数据处理相关:负责机器视觉项目中大批量3D数据(如点云、深度图像)的收集、整理、过滤和清洗。需熟练处理视觉尺寸测量任务,包括使用激光三角测量或立体视觉方法进行物体尺寸提取、形状建模和精度校准。需熟练使用Python、C++、OpenCV、PCL、Numpy、Blender等工具处理3D数据。 模型开发相关:负责3D视觉项目的物体检测、分割、姿态估计模型的数据预处理、训练、迭代、重训练,以及模型准确率提升和搜索任务。在视觉尺寸测量领域,需开发和优化相关模型(如基于PointNet的尺寸估计网络),确保测量精度达到工业标准(如微米级)。需具备Python、C++、TensorFlow/PyTorch等框架经验,并理解常用神经网络(如CNN、PointNet、Transformer变体)在3D视觉中的应用。熟悉Pandas、MongoDB(Aggregation)、Redis、Kafka等工具用于模型部署。 创新相关:对最新的3D视觉技术和趋势(如实时SLAM、神经辐射场NeRF、多模态融合)保持敏感,能够提出创新解决方案应对工业生产挑战,例如机器人路径规划中的点云配准优化或视觉尺寸测量中的实时公差检测优化,以提升质量控制效率。
1. SLAM - 负责扫地机器人激光/视觉SLAM算法、地图构建/更新的研发 - 负责基于激光雷达,imu, odom,gps,相机等多传感器融合定位研发 - 负责扫地机器人在定位和建图上的业务研发工作 2. 导航算法 - 负责扫地机导航算法的设计与实现,包括路径规划、轨迹跟踪、避障策略等核心模块 - 开发全局路径规划算法和局部路径规划算法 - 优化导航算法在复杂场景, 如狭窄区域、动态障碍物下的鲁棒性和效率 3. 运动控制与决策 - 设计扫地机的运动控制算法,包括弓字形清扫、沿边清扫、回充路径规划等功能 - 实现动态环境下的实时避障与路径调整,提升清扫效率与覆盖率 4. 多传感器融合 - 基于激光雷达、IMU、超声波、深度相机等传感器,开发环境感知与障碍物检测算法 - 实现多传感器数据融合,提升导航系统的精度与鲁棒性 5. 算法性能优化 - 针对嵌入式平台(如ARM、DSP)优化导航算法的计算效率,降低资源占用 - 提升导航算法在低算力设备上的实时性和稳定性
1. 负责多模态大模型(涵盖图像、视频、音频、文本等模态)在内容安全、活体检测、人脸识别、内容理解等场景的算法研发与性能优化; 2. 探索和实现图像、视频、文本等多模态数据的统一建模与高效表征学习,提升模型在内容审核、短视频内容理解等任务中的泛化性和鲁棒性; 3. 紧密跟进与研究业界领先的大模型技术,如InternVL3、Qwen2.5-VL等,探索并落地其在图文审核、视频内容审核、身份核验等业务场景中的应用策略及精调方法; 4. 负责构建并持续优化模型训练及推理系统,显著提升多模态模型在安全审核领域的准确率、召回率与实时响应性能; 5. 探索并实现文本生成图像技术在内容生成与审核中的应用,提升系统的生成与理解能力; 6. 与产品、工程等相关团队密切合作,推动多模态审核、识别系统的业务落地,实现业务场景的闭环验证与持续迭代优化。