高德地图大模型算法工程师-Agent或模型推理方向-APP平台业务
任职要求
1、计算机科学、电子工程、数学或相关专业的本科及以上学历;对机器学习、深度学习有扎实的理解,具备相关的项目经验或研究背景; 2、熟练掌握至少一种主流深度学习框架,如TensorFlow、PyTorch等; 3、具备良好的编程能力,熟练使用Python/C++进行算法开发; 4、了解模型推理加速的相关技术,如有相关实践经验更佳; 5、对语音识别、语音合成等领域有深入了解,有相关项目经历者优先考虑; 6、拥有强烈的求知欲和创新精神,能够快速学习新技术并在实践中应用; 7、具备优秀的沟通能力和团队合作精神。 加分项: 1、在顶级会议或期刊上发表过论文者优先考虑; 2、有开源项目贡献经历者优先; 3、对自然语言处理、计算机视觉等领域有深入了解者优先。
工作职责
岗位职责包括但不限于: 1、参与开发和优化大规模深度学习模型,特别是在Agent系统、算法推理加速以及语音处理领域的应用; 2、研究并实现前沿的算法推理加速技术,包括但不限于模型压缩、量化、剪枝等方法,以提高模型效率和性能; 3、设计和开发智能Agent系统,通过强化学习、模仿学习等技术提升Agent在复杂环境下的决策能力; 4、专注于语音识别、语音合成等语音技术的研究与开发,提升语音业务的质量和用户体验; 5、与跨职能团队合作,将研究成果转化为产品解决方案,解决实际业务问题; 6、撰写技术文档,分享研究进展和技术心得。
研究方向一:大模型智能体Agent技术研究 1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。 2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。 3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。 4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。 研究方向二:深度搜索(Deep Search/Research)技术研究 1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。 2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。 研究方向三:多模态基础模型能力建设 1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。 2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。 3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。 研究方向四:大模型分布式后训练及推理加速技术 1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。 2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。
1、探索模型通过 RL Scaling 等方式使用成套工具解决复杂问题的行动和规划能力,包括 Human in the Loop 多轮交互下 Agent 基础建模的新方案、以及与复杂环境的交互学习能力; 2、探索模型在 Non-Rule Based Outcome 场景下利用复杂信息进行有效 Reasoning 推理的范式,包括 Proactive Agent 的建模方案; 3、探索研究更多内在奖励的机制,从而激发模型主动学习和自我更新的能力; 4、探索构建长期记忆机制,为下一代高效的推理模型、长序列推理及建模提供基础
基础算法研究 一、推理思考 1.开发链式思考、思维树等推理增强技术,优化模型对复杂业务逻辑推理、策略规划等任务的深度理解。 2.探索通过大规模强化学习持续提升模型推理能力。 3. 构建业务逻辑推理评测基准,推动模型思维链的可解释性研究。 二、多模态端到端 1.研发语音-文本跨模态对齐与联合表示学习算法,解决语义鸿沟问题,提升模型对语音指令理解、语音到文本生成的鲁棒性。 2.探索语音交互场景下的多模态增强技术(如语音情感分析、端到端语音对话生成),推动模型在智能客服、语音助手的应用落地。 三、生活服务领域增强 1.大模型基座知识能力增强,打造生活服务领域基座,赋能美团各类大模型应用场景; 2.探索预训练增强阶段的大规模高质量数据自动合成、Scaling Law、长链条复杂推理反思能力增强; 3.建设生活服务chat模型与智能体,通过强化学习等方式增强模型推理反思、复杂指令遵循、高情商交互等能力。 应用算法研究 一、深度推理、规划与决策能力强化 1.优化大模型在逻辑推理、多步规划、复杂决策、多轮多步工具调用等任务上的表现,探索如RL scaling、Test-time scaling等前沿技术。 2.构建能够处理模糊与不完全信息、进行自主假设与验证的推理框架。赋能大模型实现精准的工具调用与智能体协同。 二、高度拟人化交互与专业沟通能力构建 1.赋予模型深度理解与分析专业领域问题的能力,包括隐性需求挖掘和复杂语境下的语义理解。 2.探索多轮对话中的上下文记忆、情绪感知、共情表达与高情商交互技巧,实现稳定人设、知识遵循与高度自然的对话风格。 3.研究模型主动感知用户全面信息、进行预判性服务与信息推送的策略,而非被动响应,打造能真正吸引用户持续对话的自主交互。 三、多智能体协作研发范式与前沿技术应用 1.设计和研究多智能体间的动态协调、知识/记忆共享与冲突解决机制,实现“1+1>>2”的协同效应。 2.推动面向智能体的大模型研发新范式,探索大模型智能体在环境感知、记忆与知识库管理、复杂指令遵循等基础能力的统一建模与提升路径。 四、基于强化学习的智能体优化方法研究 1.研究和改进现有的强化学习算法,实现端到端Agent性能优化,提升Agent鲁棒性与泛化能力。 2.构建面向领域任务的DeepResearch能力,提升Agent在多步骤信息检索、工具调用、推理规划等任务中的表现。
团队介绍:Gauth 是一款受全球用户喜爱的 AI 教育产品。我们致力于使用领先行业的人工智能技术,提升学生的学习体验。加入 Gauth 团队,你将有机会为全球数千万学生提供优质服务,并与顶尖专家合作,站在科技前沿,推动 AI 与教育科技的发展。 1、大模型基础能力建设:负责构建高质量教育数据集和全面的模型评估体系,支撑模型迭代优化;主导教育场景下LLM/VLM的核心算法研发与训练,持续提升模型的推理、对话等关键能力; 2、前沿技术探索与应用:追踪大模型前沿进展,探索Long-CoT、RL、AI Agent等技术在教育的应用潜力;基于技术洞察,设计创新应用模式,孵化并推动个性化AI辅导、多模态交互学习等功能的实现; 3、协作与业务落地:与产品、工程、教研等团队紧密协作,理解业务需求,共研优化技术方案;推动算法模型快速迭代、与业务场景深度融合及效果验证,负责或参与模型部署、维护与优化。