vivo多模态大模型算法工程师/专家
任职要求
1. 计算机、AI或相关专业硕士及以上学历,或同等工作经验; 2. 3年以上计算机视觉、NLP或多模态相关研发经验; 3. 对多模态大模型有深入理解,并具备扎实的微调实践经验; 4. 熟悉图像与视频理解的核心算法和技术; 5. 具备良好的数学功底和独立解决问题的能力; 加分项: 1. 在顶级会议/期刊发表过相关论文; 2. 参与过知名开源多模态大模型项目;
工作职责
1. 负责多模态大模型在图像与视频理解方向的算法研发、优化与部署; 2. 深入研究并实践多模态大模型的微调技术,以适配特定业务场景; 3. 参与构建和优化大规模多模态数据集; 4. 跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力); 5. 与团队紧密协作,推动算法在产品中的有效落地;
负责自动驾驶领域 VLM, VLA 算法研发,量产落地; 进行数据建设,指令微调,偏好对齐,模型的优化; 探索多模态的大模型,端到端 VLA 模型 在自动驾驶业务的应用。
围绕高德的核心业务场景,研究大模型与推荐结合提升业务效果并落地,不限于LLM、多模态大模型SFT、RLHF、多模态理解、内容表征、推荐算法、行为序列建模、搜索算法。 团队介绍: 团队由国内外知名高校及主流互联网企业的资深专家组成,在顶尖期刊(如KDD、NeurIPS、ICLR、ICML、AAAI等)发表过多篇论文,是国内理论与应用实践相结合、应用算法创新的顶尖和超一流团队。
1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;
高德地图定位研发团队介绍: “我在哪儿,要到哪儿去”是高德给全国亿级用户解决的核心问题, 我们系统解决“我在哪儿”的问题, 我们使用遍布全球的北斗卫星数据,高密度的手机传感器数据,视觉数据, 我们建设世界级的高精准定位系统, 驾车定位、车道级定位、室内定位、停车场定位、车机定位等 是我们核心解决的业务场景。 我们攻克着大量的世界级前沿技术难题: 基于时间序列预测的统一融合定位算法、 基于Transformer的统一融合匹配算法、 基于BEV、slam等的视觉定位算法 ...... 为了给广大用户的出行提供全方位、高质量的服务,我们正在不停地打破自己、超越自己...... 在这里,无数行业前沿的新技术在碰撞交流和应用, 这就是高德地图定位研发部 期待勇于突破,勇于挑战的你! 岗位职责: 1、多模态大模型研发与应用:将定位问题转化为大模型问题,用大模型的思路对时空数据进行建模、训练(包括但不限于预训练、SFT、强化学习等)等,实现轨迹预测和轨迹匹配; 2. 模型优化与小型化部署:负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行; 3、创新探索:跟进位置和地图领域的大模型前沿进展,应用在日常工作中。