小红书【26/27届实习】计算机视觉&多模态算法实习生-智能创作
任职要求
任职资格 1、研究生在读; 2、 计算机/电子信息/自动控制/软件工程/数学等相关专业; 3、优秀的分析、解决问题能力,对新技术充满好奇,敢于挑战高难度,善于提出解决方案并快速验证; 4、熟练掌握TensorFlow/PyTorch/Caffe/ MXNet等深度学习框架中的至少一种; 5、具备优秀的编程能力和经验,熟悉Python、C/C++、Java等编程语言,具有扎实的数据结构和算法功底; 6、具备优秀的研究和创新能力,在CVPR/ICCV/ECCV/NIPS/ICML/SIGGRAPH等会议上发表过论文者优先;参加过acm竞赛者优先;
工作职责
1、负责计算机视觉&多模态&3DGS相关算法研发,面向但不限于:3DGS、3D重建、多模态检索、embedding、多模态目标检测、分割、Metric Learning、主体识别、质量评价等等;时刻follow与探索前沿技术;(以上方向擅长一个即可) 2、负责相关算法和系统的持续迭代和进化;同时能够深入小红书丰富的业务场景,结合实际需求进行技术落地和创新;

AIGC方向 1、参与AIGC图像生成模型的研发、参与模型的构建、训练和评估,并提出改进方案以提升模型性能。 2、参与和应用小样本学习方法和技术,尝试在有限的数据集下构建有效的模型。参与实验和调研,提出创新性的解决方案,为解决实际问题提供可行的方案。 3、与产品团队合作,将研发的算法和模型转化为实际可用的产品。参与产品化的过程,协助将研究成果转化为高质量、可靠且易于使用的软件工具或服务。 虚拟人方向 1、参与前沿AIGC技术在3D人物动作、3D物体、BlendShape等3D空间应用的研究与实践,包括探索新算法和技术,提升虚拟元素的真实感和交互性。 2、协助研究并实现3D空间中不同模态之间的翻译、生成和交互,使得不同模态之间的元素能够在3D空间中相互转化和互动。 3、支持多模态大模型的应用开发,实现在3D空间中可控的元素生成和编辑,包括人物动作、物体以及BlendShape等方面的操作和调整。 4、参与Soul社交元宇宙产品的研发和部署,利用创新的技术手段提升产品的用户体验和交互效果。
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;