
美图计算机视觉工程师(人工智能部)
任职要求
●计算机/电子信息/数学等相关专业,硕士及以上学历 ●具有AIGC领域(如图像生成/编辑、视频生成/编辑)的科研经历或落地经验 ●对图像生成与编辑或视频生成与编辑等AIGC相关算法有深…
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉工程师 工作地点:厦门/深圳 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ●算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ●理论创新:研究领域最新技术,快速理解评价,思考应用场景并提出新idea ●落地实现:开发技术原型,根据业务需求提供完整算法输出

1、参与图像匹配/图像分类算法的研发与设计,包括特征提取、相似度计算、分类模型构建等核心技术模块的算法优化与性能提升; 2、参与目标检测/目标追踪算法的研发与设计,涵盖单目标及多目标检测、实时跟踪、遮挡处理等关键技术的算法实现与优化; 3、参与运动员人体姿态估计算法的研发与设计,负责关键点检测、动作识别、姿态分析等算法模块的开发与迭代优化; 4、基于海量自有数据,负责对应模块深度学习模型的搭建、训练、调优等全流程迭代工作,持续提升模型精度和泛化能力,确保算法在实际应用场景中的稳定性和有效性; 5、参与相应项目中的新技术方案调研、评估和适配性改进工作,跟踪前沿技术发展趋势,评估新算法的可行性并推动技术创新在业务中的落地应用。
负责多模态人机动作交互大模型算法的研发,推动机器人交互技术的创新与落地,具体包括但不限于: ● 研究多模态智能体、推理与规划等前沿方向,开发多模态意图理解与动作预测算法,使机器人在交互中能自主动作决策并执行; ● 构建通用动作生成模型:基于语音、视觉、语境等多模态输入,研发高自然度、高智能性的机器人物理可执行动作生成算法; ● 优化动作控制性能:设计动作生成与执行控制的联合优化算法,提升动作的流畅性、精准性与实时响应能力。

base地 北京/上海/广州/深圳 关于感知方向 感知是无人驾驶中非常复杂和有趣的部分之一,你构建的是一个人工智能集大成的系统,不是一项按部就班就能完成的工作!感知软件工程师负责无人驾驶感知系统的设计和实现,应对无人驾驶中各种最有挑战的问题: 设计高效可靠的深度学习模型,在几十毫秒内精确检测和跟踪车周围200米之内所有的障碍物(人,车,非机动车辆,交通锥等),并对场景进行理解 如何设计一般性的模型和算法去处理各式各样的长尾情况和极端环境,如路面上的垃圾袋,洒水车的水花,前车掉下来的挡板 ,如大雨,大雪,雾霾,风沙等 如何保证感知模型和算法在极端的环境里的准确性和可靠性,如大雨,大雪,雾霾,风沙等 把模型优化到极致,让十几个到几十个模型在车上有限的计算资源上欢快的运行。 如何搭建一个高效可靠的计算框架,支撑一个周期内接收几十个传感器的输入,做各种同步融合,并进行几十个深度学习模型的推理 关于机器学习和算法方向 这个方向的感知工程师负责设计并实现传感器标定,障碍物检测,分类,跟踪,和场景理解等各种模型和算法,VLM视觉语言模型落地,对模型和算法进行评估和测试, 并把模型和算法部署到车上。