小红书【27届】多模态/大模型算法实习生-智能审核
任职要求
1、较好理解大模型、多模态大模型原理,对大模型、多模态相关技术有强烈兴趣,有相关实习经验者优先; 2、英文读写能力优秀、数理及计算机基础扎实,可以快速学习新技术; 3、有较强的研究能力,复现过业内领先工作,有国际…
工作职责
1、进行多模态大模型的前沿技术探索、模型训练和应用,落地在小红书实际业务场景如智能审核、推荐、搜索、交易,多模态内容理解来解决实际业务问题 2、参与多模态大模型预训练、后训练、SFT等大规模数据训练工作 3、参与LLM/LVM相关的技术业务落地,包括但不限于多模态理解、Agent搭建、RAG、意图理解等技术 4、前沿技术探索,沉淀国际顶会论文
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
1.负责AIGC多模态大模型相关的算法模块的研发、架构设计、模型后训练、数据构建和效果评估等工作,包括各模态tokenizer设计,数据合成策略,以及跨模态融合后训练策略等,参与实现游戏领域定制化的文生图像/视频、图像/视频理解和编辑等多模态大模型的技术落地; 2.参与文本、代码、图像、视频等多模态内容的生成与理解相关算法研发与优化,熟悉包括RAG技术栈和Code理解/生成技术栈等,并支撑相应算法高效落地到游戏的各管线及工作流中; 3.进行大模型reasoning能力的相关算法探索,研究SFT/GRPO/self-play等技术,提高模型在游戏引擎代码库等场景涉及的推理任务上的表现,参与落地游戏领域具有业务问题解決能力的agent; 4.跟进大模型、多模态、强化学习、智能体的前沿算法技术研究,支持强化学习在游戏 bot 中的算法落地应用,把握AIGC生成技术的最新前沿技术发展趋势。