logo of papergames

叠纸游戏LLM Agent算法工程师

社招全职3年以上技术研发类地点:上海状态:招聘

任职要求


1. 本科及以上学历,计算机、机器学习、软件开发、数学等相关专业优先,3年以上相关工作经验;
2. 具备编程技能、数据结构算法知识,熟练掌握C++/Python编程语言;
3. 关注且熟悉前沿大语言模型动态,能深入理解工作原理与场景;
4. 具备大模型RAG 知识库增强检索、开源/闭源大模型(PT SFT RLHF DPO GRPO)、提示词工程等相关领域实践和案例经验;
5. 优秀的沟通和跨部门协调能力,对技术充满热情,乐于接受挑战和解决问题;
6. 加分项:有相关学术成果发表者。

工作职责


1. 研究前沿的大型语言模型(LLM)技术,包括但不限于:大型语言模型及其微调技术、检索增强生成(RAG)、提示工程和基于知识的对话系统等;
2. 提升基础模型的整体性能,涵盖数据获取、模型评估、监督微调(SFT)、奖励建模及强化学习等;
3. 持续推动大型语言模型的核心技术发展,不断优化理解、推理和生成能力;
4. 与跨功能团队合作,将先进的LLM解决方案集成推动。
包括英文材料
学历+
机器学习+
数据结构+
算法+
C+++
Python+
大模型+
RAG+
SFT+
相关职位

logo of amap
实习高德研究型实习生

职位描述 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地。 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-10
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-11
logo of antgroup
社招2年以上技术类-算法

负责LLM Agent在客服机器人领域的落地和优化,提升在线客服系统的智能化水平和用户体验,主要工作包含: 1. 数据构建、指令微调、偏好对齐、模型优化等; 2. 开发基于Agent的对话系统,实现宽业务场景下的多轮对话以及复杂任务规划; 3. 和其他领域Agent的协同工作; 4. 跟踪Multi-Agents最新进展,结合业务进行创新,并沉淀为顶会论文。

更新于 2025-08-27
logo of alibaba
实习淘天集团2026

1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破复杂推理、数据洞察、AI搜索、文案创作、图像连续编辑等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。

更新于 2025-05-07