
美图计算机视觉工程师(人工智能部)
任职要求
●计算机/电子信息/数学等相关专业,硕士及以上学历 ●具有AIGC领域(如图像生成/编辑、视频生成/编辑)的科研经历或落地经验 ●对图像生成与编辑或视频生成与编辑等AIGC相关算法有深…
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉工程师 工作地点:厦门/深圳 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ●算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ●理论创新:研究领域最新技术,快速理解评价,思考应用场景并提出新idea ●落地实现:开发技术原型,根据业务需求提供完整算法输出

1、参与图像匹配/图像分类算法的研发与设计,包括特征提取、相似度计算、分类模型构建等核心技术模块的算法优化与性能提升; 2、参与目标检测/目标追踪算法的研发与设计,涵盖单目标及多目标检测、实时跟踪、遮挡处理等关键技术的算法实现与优化; 3、参与运动员人体姿态估计算法的研发与设计,负责关键点检测、动作识别、姿态分析等算法模块的开发与迭代优化; 4、基于海量自有数据,负责对应模块深度学习模型的搭建、训练、调优等全流程迭代工作,持续提升模型精度和泛化能力,确保算法在实际应用场景中的稳定性和有效性; 5、参与相应项目中的新技术方案调研、评估和适配性改进工作,跟踪前沿技术发展趋势,评估新算法的可行性并推动技术创新在业务中的落地应用。
负责多模态人机动作交互大模型算法的研发,推动机器人交互技术的创新与落地,具体包括但不限于: ● 研究多模态智能体、推理与规划等前沿方向,开发多模态意图理解与动作预测算法,使机器人在交互中能自主动作决策并执行; ● 构建通用动作生成模型:基于语音、视觉、语境等多模态输入,研发高自然度、高智能性的机器人物理可执行动作生成算法; ● 优化动作控制性能:设计动作生成与执行控制的联合优化算法,提升动作的流畅性、精准性与实时响应能力。
主要职责: (图像识别 三维重建经验 51word toC 袋鼠 数字孪生 新能源汽车) 1. 三维建模技术研究,包括NeRF建模、可微分几何建模、3D Gaussian Splatting建模算法等; 2. 负责非限定场景下的高精度相机位姿估计研究,包含COLMAP算法、SLAM算法等; 3. 负责3D Diffusion相关技术研究,包括多模态3D AIGC、材质生成等; 4. 负责隐式三维模型编辑相关技术研究,包括模型压缩、材质&光照解耦、显式&隐式模型融合等。 5. 负责通过人工智能的方式,提升过程效率和自动化程度,降低人工参与的成本,参与其他相关业务的 AI算法研发、数据处理、模型训练、模型调优和训练流程自动化;