网易Agent 模型算法工程师
任职要求
1. 硕士及以上学历,计算机、人工智能、机器学习等相关专业(优秀者可放宽至本科)。 2. 精通 Python,熟练使用 PyTorch 等深度学习框架,具备良好的代码风格与工程习惯。 3. 具备 LLM/SLM 训练与微调经验,熟悉 SFT、对齐与强化学习相关方法(如 PPO/GRPO/DPO 等)的原理与实践。 4. 熟悉 Agent 体系与典型范式(Plan-Execute、ReAct、工具调用/函数调用、记忆与…
工作职责
1. 面向有道词典、词典笔、学习规划/小P老师等产品线,负责 Agent 能力的整体方案与核心算法研发,包括任务分解、计划-执行/反思循环(Plan-Execute / ReAct / Reflection)、长短期记忆与工具路由等。 2. 负责 SLM(Small Language Model)持续预训练与指令微调(SFT),构建高效压缩与蒸馏方案,面向端侧/低延迟场景优化推理效率。 3. 设计与实现工具调用(Function/Tool Calling)体系:工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性,提升工具使用的成功率与收益。 4. 基于强化学习(PPO/GRPO/DPO 类方法等)与奖励建模,面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化,支持离线/在线策略迭代。 5. 负责搜索与排序相关模型:语义检索embedding/rerank、学习排序(pointwise/pairwise/listwise)、点击/转化信号建模与评估。 6. 负责数据全链路:高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建。 7. 建立系统化评测体系:离线基准(理解/工具成功率/可用性)、端到端任务评测、A/B 实验与线上指标监控,推进效果持续迭代。 8. 推动工程化落地:训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化。 9. 跨团队协作,与产品、工程、数据及标注团队紧密配合,按期高质量交付,持续提升用户体验与业务指标。
美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 支持智能客服项目,负责对话理解和生成类任务的算法建模工作,包括但不限于知识和指令遵循、深度推理、反思和评估等能力的优化和落地。 2. 参与大模型研发及业务落地,支持客服机器人、客户之声、风控等多场景的效果优化。 3. 通过系统建设,降低业务分析数据的门槛,影响和提升业务对数据价值挖掘的能力和效率。 4. 深入理解本地生活服务业务场景,抽象业务所需的大模型基础能力深度优化,推动相关技术在实际业务中的应用。 5. 参与技术创新探索,挖掘大模型落地场景。
1. 研究视觉多模态大模型前沿技术,包含但不限于视觉编码器、语言大模型等技术,探索在新一代智能语音助手中的应用。 2. 负责GUI Agent模型的后训练技术改进,包括有监督微调、强化微调和离在线强化学习,提升模型的任务完成率。 3. 负责研发GUI Agent前沿技术研究及在车载/手机/音箱/电视小爱同学落地。
1. 构建行业有影响力的各类智能体和研究对应学术前沿问题,训练业界效果领先的大模型智能体模型,并通过发表论文、开源、竞赛等,打造学术影响力; 2. 打造业界一流的通用大模型智能体解决方案,并落地小米核心业务。 【课题名称】 大模型智能体研究与应用 【课题内容】 构建行业有影响力的各类智能体和研究对应学术前沿问题,包括但不限于: 1. 研究通用任务AI Agent核心技术,包括但不限于规划、工具调用、多智能体等,并构建和开源业界有影响力的AI Agent模型和解决方案; 2. 研究GUI Agent相关核心技术,包括但不限于SFT、离线强化学习、在线强化学习等,并训练和开源业界有影响力的GUI Agent模型; 3. 研究强化学习算法全流程核心技术,包括但不限于算法优化,奖励函数设计、环境构建等,并基于强化学习构建和开源业界有影响力的推理大语言模型、GUI Agent模型、deep search模型等; 4. 研究RAGRAG全流程核心技术,包括但不限于音-视-文全模态理解与生成、端侧RAG等,并推动相关领域技术突破和业务落地。
团队介绍: 我们团队负责高德出行大数据的分析和应用开发,在机器学习、深度学习、大模型agent等方向探索解决业务问题,洞察业务机会,打造智能化的用户出行数据引擎。我们鼓励创新,鼓励发表论文和申请专利,乐于用新技术在业务方向做实际落地的尝试,期待你的加入! 具体职责包括但不限于: 1、负责机器学习、深度学习领域的数据挖掘研发工作,应用高德人地时空大数据挖掘用户画像、解决用户痛点问题; 2、负责时空大数据与AI Agent结合的应用实践,探索时空大数据Agent落地时间; 3、针对特定的业务场景对基座大模型进行微调优化,实现专属技能模型的能力升级和性能提升。