logo of xpeng

小鹏汽车大模型算法实习生(Agent Memory方向)

实习兼职地点:北京状态:招聘

任职要求


专业:计算机、人工智能、数学等相关专业硕士及以上在读;
技术:深刻理解 Transformer 架构及 LLM 原理,熟悉SFTRLHF等相关技术细节;
编程:具备优秀的编程能力和vibing cod…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


聚焦 Agent Memory(智能体长短期记忆) 核心机制的基础研究与前沿探索,致力于提升 LLM Agent 在长周期、复杂任务中的推理与泛化能力:
参数记忆:探索参数记忆机制及信息压缩相关技术,提升智能体在跨领域任务上的长程推理能力。
持续学习:探索长期记忆的巩固、遗忘、反思等更新机制,研究如何通过长期交互实现持续进化。
记忆系统:agentic memory相关研究,上下文工程探索等,提升记忆系统的能力边界。
【岗位优势】计算资源充足,有具体的实践和落地场景
包括英文材料
Transformer+
大模型+
SFT+
RLHF+
Python+
还有更多 •••
相关职位

logo of meituan
实习核心本地商业-业

【课题说明】 以大模型对话技术为核心,探索前沿技术问题。研究方向包括角色扮演、个性化对话、记忆管理,拟人化,数字人等,主要业务场景包括运营,招聘,销售,审核等。目标是构建覆盖多个场景的Agent系统,实现“技术驱动业务范式”的升级转变。 【建议研究方向】 1. 大模型个性化(Personalized LLM):通过角色扮演、用户行为数据挖掘与建模、上下文理解等方法,分析用户情感状态,提升模型的个性化回复能力。 2. 面向语音交互的拟人化技术(Voice Agent):优化大模型在语音对话场景的效果,提升大模型的拟人化水平,探索下一代端到端语音对话大模型的技术实现。 3. 记忆管理与增强(Memory):通过优化模型长上下文能力、设计记忆抽取与管理模块,提升系统的记忆能力。 4. 基于LLM的RL(LLM-based RL):通过强化学习,提升模型规划、决策、推理等能力。 我们将提供充足的计算资源和良好的工作自由度,目标是产出有影响力的工作,解决业务实践中的问题。

更新于 2025-05-27北京
logo of bytedance
实习A106762

团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行“激发生意新可能”理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题背景 在广告营销领域,智能客服系统正成为优化售前用户沟通的关键工具,商家亟需高效工具来减少人工依赖、提升转化效率。背景核心在于:广告营销的售前场景涉及复杂用户交互(如产品咨询、促销引导和留资获取),当前基于 LLM 的智能客服 Agent 系统采用 “规划 + 生成” 的架构,需完成从用户进线、诉求澄清到方案执行的全流程服务。然而,随着广告市场的动态变化和个性化需求增长,传统方法面临响应相关性不足、转化率瓶颈等问题。团队正聚焦于利用 LLM 后训练技术(如微调和强化学习),结合 RAG、CoT 蒸馏等手段,构建一套高适配性的 Agent 系统,以实现智能化用户沟通 —— 帮助商家自动促成订单或获取高质量线索,最终提升广告营销的 ROI 和用户体验。这一方向不仅是业务增长的核心驱动力,也是推动大模型在广告领域落地的关键创新。 课题挑战 本课题面临多重技术与业务挑战,需要人才在 LLM-Agent 架构下突破瓶颈,确保智能客服在广告营销场景中的高可靠性、高效性和合规性。具体挑战包括: 1)对话流程控制:售前咨询需通过多轮交互引导用户留资或促成订单,亟需优化 Agent 的决策能力。这要求强化planning的识别能力和action选择的准确性,需要引入 SOP 构建、CoT蒸馏、react与反思机制等,实现上下文一致性与业务目标达成。另外也需要构建合理的reward指标,应用DPO/RL等手段进一步提升模型决策能力; 2)回复质量与幻觉:售前咨询的回复模型需要在少量标注数据下产出高质量的训练数据,应用大模型微调SFT、CoT蒸馏提升在各个行业上的话术质量和回复满意度。应用RAG、知识图谱等能力构建高质量知识库,在线时通过精确知识点匹配解决冷启动与幻觉问题,提升用户体验; 3)个性化问题:目前传统智能客服对于不同用户的接待基本都是相同的,售前客服需要考虑不同用户的兴趣点,通过引入用户特征、构建长期memory等手段,为用户构建定制化的接待方案,提高用户满意度并促成留资或者订单等业务指标提升; 4)实时性能瓶颈:系统需处理高并发请求,但大模型的推理延迟和资源消耗可能影响用户体验。这要求研究模型压缩、量化技术、推理模型的cot加速等方向以优化部署效率。 研究方向:大语言模型。

更新于 2025-06-13北京
logo of bytedance
实习A89253

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责火山引擎-方舟大模型平台的Agent技术研发,包括Multi-Agent框架、Memory机制、Agent-RL等基础能力建设; 2、开发UI-Agent、DeepResearch Agent等专业领域Agent,提升大模型在特定场景的应用能力; 3、设计并实现易用高效的Agent开发套件,降低开发者使用Agent技术的门槛; 4、探索Agent方向的创新方法与技术,提出更先进的Agent范式,引领行业技术发展; 5、探索面向Agent的评估方法,构建火山方舟Agent评估体系。

更新于 2025-04-21北京
logo of bytedance
实习A168144

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音研发团队,主要负责抖音短视频的业务和技术研发、公司全部产品的内容安全业务。截至2020年8月,抖音日活用户超6亿,并继续保持高速增长。未来一年,抖音将更多关注对创作者和社会的价值。团队汇聚各种背景的顶尖人才,在更大体量更为复杂的业务场景中不断提升,在项目0-1的过程中影响上亿用户。期待你的加入! 1、负责抖音运营与生态团队大模型相关的业务开发,包含创作者服务(流量、培优、创作灵感等)以及对内的抖音规模化运营能力建设,快速搭建应用并在业务中落地,持续优化产品体验、稳定性; 2、与产品经理、数据分析师、算法、数据工程师等角色紧密合作,理解业务需求,制定技术方案,并推动项目的落地和优化; 3、持续探索在各种场景下,利用AI能力增强产品体验,提升工程效率。

更新于 2025-03-05厦门