高德地图高德-大模型应用算法工程师-多模态/Agent方向
任职要求
1、计算机、通信、自动化、电子、数学、统计等理工科专业,硕士及以上学历; 2、具备扎实的Python、C++或者Java等编程基础,熟练使用PyTorch/Tensorflow至少一种主流深度学习框架; 3、具备扎实的NLU/NLG相关NLP技术基础;熟悉ChatBot、文本摘要、机器翻译、问答系统等至少一种NLP任务;熟悉主流LLM架构,对于基于LLM的Pretrain、Fine-tuning、Alignment、RAG、Test-time Scaling等至少一个方向有比较深入的研究和实践; 4、具备扎实的AI MAS(Multi-Agent System)相关的感知、规划、记忆、工具调用、协同等技术基础,有实际应用和落地经验优…
工作职责
团队简介: 我们是高德行中智能团队,我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的通用工程架构,打造有温度、有惊喜、科技感十足的下一代出行体验; 在这里,我们一起建设应对超大业务规模和场景,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索智慧出行最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成技术;基于语音、视觉、位置等多模态信息搭建高吞吐、低时延、强智能、真人感的Agent体系,打造全新人和环境交互形态; 职位描述 探索下一代多模态出行体验 基于全双工多模态agent,构建人和环境的全新交互形态
团队介绍: 高德地图为您导航,前方路口请“左转”,我们是高德地图交通&行中智能团队。 我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的工程架构,打造有温度、有惊喜、科技感十足的智能出行体验; 在这里,我们一起建设应对超大业务规模,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索导航领域最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成、Agent等技术,打造全新的出行交互体验; 团队简单直接、有情有义、温暖有爱,欢迎加入,一起用技术驱动创新,为海量用户护航! 职位职责包括但不限于: 基于前沿的AIGC、LLM/LVM、MLLM多模态理解与生成、AI Agent等技术,实现高德地图导航过程全场景、全时空、多模态的内容理解/生成以及智能交互,不断提升用户的出行质量和体验。
团队简介 我们是高德行中智能团队,我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的通用工程架构,打造有温度、有惊喜、科技感十足的下一代出行体验; 在这里,我们一起建设应对超大业务规模和场景,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索智慧出行最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成技术;基于语音、视觉、位置等多模态信息搭建高吞吐、低时延、强智能、真人感的Agent体系,打造全新人和环境交互形态; 职位描述 探索下一代多模态出行体验 基于全双工多模态agent,构建人和环境的全新交互形态
【课题说明】 聚焦多模态数字人核心技术,以直播为应用场景,旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力,并与用户进行深度多模态内容互动的下一代数字人,革新直播行业运营模式与用户体验。 【建议研究方向】 1.智能运营Agent:研究数字人作为智能Agent,在直播前(策划、脚本、货盘)、中(场控、问答、促单)、后(复盘、再创)全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同,提升直播运营效能。 2.高表现力数字人生成驱动:探索高真实感、个性化数字人形象(外观、声音、风格)的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动,增强直播感染力。 3.多模态内容生成和交互:研究理解用户多模态输入(文、语、图、视频)并进行深度互动。探索数字人自主生成动态多模态内容,丰富直播呈现,提升用户参与感。
机器智能部门介绍: 蚂蚁集团大安全事业群机器智能团队致力于打造安全科技的核心竞争力,做可信AI的持续引领者,为广大支付宝用户的数字化生活提供全方位安全保障。作为蚂蚁集团安全版图中的核心力量,我们正以最前沿的AI算法为刃、以大模型为盾,编织数字世界的"安全之网"。在这里,大模型、智能体、AI安全等热门的研究不再是纸上谈兵,每一个方向都在落地成为真实业务场景、十亿级用户的智慧防线。 关于团队,过去获得过浙江省科技进步一等奖、中国电子学会科技进步一等奖,人工智能学会吴文俊人工智能自然科学奖一等奖,中国图象图形学学会科技进步一等奖、多次获得中国计算机学会科技进步奖、世界人工智能大会SAIL之星与"镇馆之宝",等多个重量级奖项。可信AI专利布局全球第一,主导制定ITU国际风控标准。多名Kaggle Grandmaster ,拿过多个KDD Cup/CVPR/NeurIPS/ICCV/CVPR/ECCV等多个顶会竞赛冠军,累计发表近百篇顶会论文; 在这里,你将有机会和毕业于海内外著名高校的行业专家们、众多KDD Cup/CVPR 等比赛冠军、Kaggle Grandmaster 、顶会论文作者们共同根植蚂蚁丰富的场景数据,利用海量算力探索创新前沿算法应用,使用领先的机器学习算法解决风控业务问题,构建数据与知识驱动的智能风控体系,提升用户的支付安全体验。 加入我们,让我们一起为世界带来微小而美好的改变。 UI Agent方向,单步慢思考、多步强化学习研究,提升理解和规划推理能力,AI自主完成复杂的Phone/Computer/Browser Use任务