拼多多大模型Agentic后训练工程师（代码智能体方向）

社招全职技术类2026-04-30地点：上海状态：招聘

扫码手机上打开

任职要求

1.计算机、人工智能、软件工程等相关专业，本科及以上学历。
2.具备扎实的深度学习基础，精通 Transformer 架构及大规模语言模型训练与优化原理。
3.熟练掌握 Python，编码与工程落地能力强；熟悉主流大模型训练框架（如 Megatron、Verl 等）。
4.自驱力强，学习能力出色，能够快速跟进并复现学术界与工业界最新后训练方法，完成系统化工程应用。
5.具备敏锐的数据分析与…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.负责 Code Agent 大模型的全流程后训练，包括 Mid-Training、SFT、RL 等阶段的设计、实现与迭代，持续突破模型的代码能力边界。
2.构建并优化各训练阶段所需的高质量数据集，涵盖数据清洗、合成、增强与质量评估，为模型优化提供数据底座。
3.深入分析模型行为与输出分布，诊断典型失败模式，通过数据与训练策略的针对性调整，提升代码生成的正确性、可读性与安全性。
4.跟踪并探索前沿 Code Agent 技术，推动研究成果的工程化落地。
5.与产品和工程团队紧密协作，将后训练能力集成到智能编程助理、自动化代码生成系统及任务执行 Agent 等产品中。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

深度学习+

Transformer+

Python+

大模型+

Megatron+

还有更多 •••

登录查看完整学习资料

相关职位

日常实习生-大模型后训练/Agentic算法（行为风控方向）

实习阿里巴巴日常实习

岗位面向行为风控这一高度复杂且动态对抗的业务场景，支持反爬、作弊、欺诈、账号安全、恶意行为等核心风控业务，聚焦大模型后训练与Agentic等前沿技术，探索下一代智能风控基座和行为域基模解决方案。 1、参与行为域数据体系建设：面向行为风控场景中的结构化、序列化、图表化等数据，参与数据处理、任务构建和评测方案设计；探索面向结构化数据的大模型后训练方法，参与行为特色“世界模型”的研究与验证。 2、参与强化学习方案设计：围绕行为风控中的复杂任务，参与Reward System、RL后训练、复杂决策、自我博弈等方向的研究与实验；协助推进全链路情报分析与风险决策能力的建模和优化。 3、参与Agent训练环境和方案构建：面向行为分析、识别、挖掘、链路还原、路径推演等场景，参与可扩展Agent训练环境的设计、搭建与迭代；支持复杂任务下Agent能力评测、训练数据构造和效果分析。 4、参与技术探索与效果分析：跟进大模型后训练、RLHF、Agent、世界模型等方向的前沿研究；结合业务场景，参与实验设计、结果分析和方案迭代，推动研究成果向真实业务问题靠近。

更新于 2026-06-30北京

大模型Agentic Ops研发工程师-基础技术

社招基础后端

岗位定位： 1、本岗位面向公司级生产保障场景，聚焦大模型与 Agent 能力在故障发现、问题定位、变更分析和处置协同中的工程化落地，建设面向研发和运维流程的 Agentic Ops 能力。 2、候选人需具备扎实的平台研发能力和工程系统思维，能够结合大模型、Agent、知识工程等新兴技术，推动智能化能力在生产保障体系中的落地。工作职责： 1、参与公司级生产保障与平台工程相关系统建设，参与 DevOps、高可用、AIOps、AI Native 等方向的架构设计、研发实现和持续演进。 2、围绕智能告警、根因定位、变更风险分析、故障诊断、预案推荐、容量评估等场景，迭代面向复杂生产环境的智能化平台能力。 3、建设 Agentic Ops 相关工程能力，包括任务编排、上下文管理、效果评估、执行约束、人工确认和安全兜底机制。 4、参与研发、运维与 AI 协同模式建设，探索 Agent、工具调用、任务编排、执行辅助等能力在生产保障流程中的应用。 5、跟踪 AIOps、LLM、Agent、RAG、云原生和平台工程等方向的发展趋势，推动前沿技术在真实工程场景中的验证和落地。

更新于 2026-06-08上海|杭州

大模型-Agentic RL框架研发工程师

社招3-5年引擎

【业务介绍】小红书业务技术部-引擎架构团队，支撑社区、搜索、商业化等小红书核心业务落地AI技术： 1. 参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)的算法易用的Agentic-RL训练框架； 2. 通过并行计算优化、分布式架构优化、异构调度等技术优化RL训练效率

更新于 2026-04-02北京|上海

1688-大模型(Agentic AI)算法工程师-杭州

社招2年以上

1、Agent业务相关垂直领域模型agent数据合成/后训练； 2、后训练的AI Agent通用能力（如tool use, planning等）增强，增强工具链路调用、知识图谱推理、report生成能力； 3、参与AI Agent产品的需求分析、技术选型、方案设计、用户体验提升等，发现算法提升对于AI Agent落地的价值，参与下一代AI agent产品打造；

更新于 2026-01-12杭州