logo of papergames

叠纸游戏LLM Agent算法工程师

社招全职3年以上技术研发类地点:上海状态:招聘

任职要求


1. 本科及以上学历,计算机、机器学习、软件开发、数学等相关专业优先,3年以上相关工作经验;
2. 具备编程技能、数据结构算法知识,熟练掌握C++/Python编程语言;
3. 关注且熟悉前沿大语言模型动态,能深入理解工作原理与场景;
4. 具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 研究前沿的大型语言模型(LLM)技术,包括但不限于:大型语言模型及其微调技术、检索增强生成(RAG)、提示工程和基于知识的对话系统等;
2. 提升基础模型的整体性能,涵盖数据获取、模型评估、监督微调(SFT)、奖励建模及强化学习等;
3. 持续推动大型语言模型的核心技术发展,不断优化理解、推理和生成能力;
4. 与跨功能团队合作,将先进的LLM解决方案集成推动。
包括英文材料
学历+
机器学习+
数据结构+
算法+
还有更多 •••
相关职位

logo of amap
实习高德研究型实习生

职位描述 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地。 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-10北京
logo of amap
实习高德研究型实习生

职位描述: 面向高德“小高老师”AI搜&对话场景,满足用户出行、打车、信息获取等各类需求,目标做出业界顶尖的Agent智能体; 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、Memory机制、RAG技术、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、多场景工具调用、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2026-01-13北京
logo of 10jqka
校招AI 算法类

职位亮点: 参与下一代 AI驱动的软件测试系统研发,构建基于大模型的 Test Agent,实现软件测试流程的自动化与智能化。探索通过大模型、Agent等技术实现 接口测试自动化、测试用例生成、复杂系统测试自动执行 等能力,推动 AI 在软件工程与测试领域的落地应用。 团队关注 AI4SE(AI for Software Engineering)、Agent、大模型等前沿技术方向,鼓励技术创新和论文发表。 岗位职责 1、参与基于大模型的 Test Agent / AI测试系统 研发,构建能够自动执行软件测试任务的智能Agent。 2、研究并实现 AI驱动的软件自动化测试技术,包括但不限于:前后端自动化测试、测试用例自动生成、测试流程自动执行、测试覆盖率与系统行为分析 3、结合 LLM、RAG、Agent、工具调用等技术,构建智能化的软件测试平台。 4、参与设计 自动化测试框架与系统架构,提升测试效率与质量。 5、持续跟踪 AI4SE、大模型、Agent等领域的前沿技术,并将研究成果应用到实际产品中。

杭州
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2026-03-26北京