logo of alibaba

阿里巴巴业务技术-AI Agent 后训练专家(急招)-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 本科及以上学历,具备计算机科学/人工智能/统计学/数学或相关专业背景
2. 2年以上软件工程经验,1年以上LLM算法经验,精通Python/JAVA等主流编程语言
3. 深入掌握SFT、RLHF、DPO、PPO等主流后训练算法,能够根据业务场景选择和优化算法
4. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


加入我们,你将构建阿里集团企业级Agent平台后训练技术体系,支撑核心电商、零售、本地生活等丰富业务场景的AI方案效果持续提升,通过先进AI技术探索,持续提升业务效果迭代飞轮,发现新的业务机会!

具体你将会负责:
1. Agent效果优化体系建设
    ○ 构建面向Agent平台的模型后训练技术体系,包括SFT(监督微调)、RLHF(基于人类反馈的强化学习)、DPO(直接偏好优化)等技术栈
    ○ 设计并实施Agent效果持续优化的数据飞轮机制,实现模型能力的自动化迭代升级
2. 平台化能力建设
    ○ 将复杂的后训练技术封装为平台化能力,降低业务方使用门槛
    ○ 支持多种场景的Agent定制化优化,如对话理解、任务规划、工具调用等
3. 评测与对齐体系
    ○ 建立Agent效果评测体系,包括自动化评测和人工评测
    ○ 设计偏好学习和人类反馈收集机制,确保Agent行为符合业务预期
包括英文材料
学历+
大模型+
算法+
Python+
还有更多 •••
相关职位

logo of alibaba
社招3年以上

你可以获得: • 参与前沿AI技术研发,引领行业技术发展 • 与顶尖技术团队协作,攻克技术难题 • 技术成果直接服务海量用户,创造实际价值 • 完整的技术成长路径和职业发展机会 1. AI应用系统构建 • 设计和构建基于大模型的AI应用系统,包括智能客服、代码助手、AI运维等产品 • 运用指令微调(SFT)、强化学习(RLHF/DPO)等技术优化模型在特定场景的表现 • 构建完整的AI应用架构,涵盖数据处理、模型部署、用户交互等全链路 2. Agent智能体开发 • 设计和实现智能Agent系统,具备任务规划、工具调用、多轮交互等核心能力 • 构建多Agent协同框架,实现智能体间的分工协作和知识共享 • 探索Agent在复杂业务场景中的应用模式,如自动化运维、智能分析等 3. 业务场景优化 • 深入理解业务需求,将AI技术与实际场景深度结合,提升用户体验 • 优化AI应用在多轮对话、知识问答、决策支持等场景的效果和效率 • 与产品和工程团队协作,推动AI应用从原型到生产的完整落地

更新于 2025-10-29杭州
logo of antgroup
社招3年以上技术类-算法

1、负责支付宝数字化风险防控体系能力的建设,包括数字内容、电商商品、短视频、直播互动等领域,应用大模型(不限于LLM、MLLM、AI Agent等)进行风险防控的能力建设; 2、负责支付宝数字化风险领域面向智能领域的全面升级,设计算法解决方案,解决疑难点问题,规划中长期发展路线,推动算法的长期迭代; 3、根据业务场景制定有效的模型训练方案,解决算法领域相关重/难点问题,协同团队达成相关模型的性能指标,创造业务价值和技术价值; 4、不断探索前沿智能技术,进行重点难点技术攻关工作。

更新于 2025-09-16北京|杭州
logo of antgroup
社招3年以上技术类-开发

1. 参与蚂蚁星河金融AI应用设计和开发,支持大模型研发训练以及在业务场景的应用落地 2. 负责信贷/资管/金市投研/营销等场景大模型应用场景的落地建设,以及相关AI平台系统的架构设计与开发; 3. 负责大模型性能分析和进行调优,识别和解决瓶颈问题,包括不限模型微调训练和模型评测等,提升模型效果和推理速度;

更新于 2025-10-30杭州|重庆
logo of antgroup
社招4年以上技术类-算法

1.通过研发领域大模型、AI Agent等技术实现垂直领域上的严格深度分析、智能交互等能力,不断提升大模型在商业场景中的应用价值。 2.在企业信用业务场景下对企信产品智能能力等业务需求提供算法视角输入,通过算法能力帮助团队和业务铺路搭桥,并推动内外部资源,为最终目标负责。 3.跟踪学术界和工业界的最新进展,不断引入创新技术到项目中并与团队成员分享,帮助团队成长。协助提升团队影响力,积极攻关技术前沿,鼓励并支持将研究成果沉淀到系统内并产出技术文章、专利和学术论文。

更新于 2025-11-26杭州