logo of alibaba

阿里巴巴AI应用算法工程师

实习兼职阿里巴巴2027届实习生地点:北京 | 广州 | 杭州 | 上海状态:招聘

任职要求


1.基础条件
● 计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制。
● 有顶会论文(ACL/EMNLP/ICLR/NeurIPS/ICML等)/高影响项目/开源贡献者加分。

2.专业能力
● 模型与后训练:解Transformer/LLM模型架构、演进原理与局限;具备SFT/DPO/RL等后训练与迭代能力(含数据/评估/优化),对后训练算法有实践经验和深刻认知;拥有Agentic RL训练实操经验者优先。
● Agent与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先。
● 数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先。
● 评测与交付:能搭建评估闭环(autorater/LLM-as-jud…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。

具体职责包括以下相关方向的一项或多项:
1.需求与问题定义
● 深入业务与产品共创需求,将诉求转化为可执行的AI任务定义,明确目标、边界、优先级与验收口径。
2.方案与应用架构
● 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Memory、Tool Use、多Agent等能力的工程化落地与生产级集成。
3.数据飞轮与治理
● 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。
4.模型适配与后训练
● 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。
5.评测体系与实验
● 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。
6.生产交付与运营
● 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。
包括英文材料
ACL+
EMNLP+
NeurIPS+
ICML+
Transformer+
大模型+
SFT+
算法+
AI agent+
RAG+
还有更多 •••