logo of alibaba

阿里巴巴研究型实习生-业务技术-AI Agent应用算法实习生(SRE根因分析)

实习兼职淘天集团研究型实习生地点:杭州状态:招聘

任职要求


1. 计算机科学、人工智能、数学、统计学或相关专业硕士及以上学历,博士或有国际顶会论文发表者优先。
2. 精通Python,熟悉PyTorch深度学习框架,对LLMAgent领域有深入研究,有AI Agent相关研发经验(如多智能体协作、决策优化、强化学习与SFT结合等)。
3. 了…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 探索基于强化学习的智能运维(SRE)Agent技术,通过模拟复杂故障场景训练决策策略,构建具备根因诊断、自主决策的智能系统,结合推理规划、多轮工具调用、因果推断与反事实推理等前沿技术,推动运维智能化的突破性进展。
2. 参与核心算法设计与系统开发,探索结合因果建模与反事实推理方法,解决动态环境下的根因诊断与决策优化问题。
3. 基于真实生产数据或开源数据集,搭建故障模拟环境并定义多维度奖励函数,实现多轮工具调用能力(如日志分析、指标监控、配置管理API),构建端到端的智能运维原型系统,设计对比实验评估Agent性能,撰写技术报告并参与论文或专利撰写。
包括英文材料
学历+
Python+
PyTorch+
深度学习+
大模型+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团研究型实

1. 参与基于AI Agent的智能运维系统研发,通过多监控指标的时序预测与自适应阈值动态建模技术,构建高效、精准的故障发现与预警体系,支撑企业级运维场景的智能化升级。 2. 探索端到端的AI算法解决方案,提升故障预测的灵活性与准确性。 3. 探索开发基于AI Agent的多监控指标时序预测方案,融合文本、日志、指标等异构数据,实现跨模态特征提取与动态关联分析。 4. 构建自适应阈值动态建模框架,结合在线学习与强化学习技术,实现阈值随业务负载与环境变化的实时调整。

更新于 2025-11-05杭州
logo of alibaba
实习淘天集团研究型实

1. 设计并优化职能Agent架构,包括但不限于内部业务知识利用,Agent记忆、上下文工程、工具调用、多智能体协作等,打造AI数字员工,提升职能团队整体工作效率。 2. 参与Agent模型训练过程,包括业务场景相关的SFT数据合成、Agentic RL等,设计高效的策略优化算法,结合私域知识、公域知识、历史经验等信息,通过稳定的Agentic RL,提升Agent多轮交互能力,实现AI数字员工与职能团队的协作效率提升,撰写顶会论文并进行业务落地。

更新于 2025-11-05杭州
logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 高德打车算法团队致力于用前沿AI技术重塑每一次打车体验。我们不是在做“推荐路线”,而是在理解用户为什么这样出行——他们偏爱哪条路?为何总在某个路口取消订单?哪些投诉背后藏着未被听见的需求? 我们正在寻找对用户行为洞察和大模型落地充满热情的实习生,与我们一起,用AI读懂出行的“潜台词”,让平台更懂你。 在这里,你将: • 构建用户出行偏好画像 基于海量行程数据,利用大模型(LLM)挖掘用户在路线选择、上下车点偏好、出行时段等方面的隐性行为模式,构建个性化出行画像,驱动个性化推荐与服务预判。 • 挖掘路线与上下车点的“隐藏特性” 分析亿级路线片段与上下车点的时空特征,通过大模型语义理解与多源信息融合,提炼可量化、可解释的“路段 / POI 质量标签”,优化点线相关推荐服务的质量。 • 提升投诉反馈的智能响应与信息透出能力 构建基于大模型的客诉理解与归因系统,自动识别投诉核心诉求(如“绕路”“司机态度”“等太久”),关联具体路线/上下车点/时段,生成结构化反馈报告,推动产品优化与客服话术升级,实现“从听抱怨到改体验”的闭环。 • 推动大模型技术在真实场景中的闭环落地 应用RAG、SFT、DPO、AI Agent等技术,构建可解释、可追踪、可迭代的智能系统,让模型不只是“跑得准”,更能“说得清、改得动、用得好”。 你的工作将直接服务全国数亿用户,每一次模型优化,都可能让一位用户少等5分钟、多一份安心、少一次投诉。你不是在写代码,你是在重塑人与出行之间的信任关系。

更新于 2025-09-25北京
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 蚂蚁国际当前处于全球化和AI规模化应用的战略关键节点中,为支持多条业务线的业务规模化增长,蚂蚁国际风控致力于AI的创新及其在风控场景的应用。应用场景包括但不限于基于多智能体的风控决策系统, Deepfake识别,风控深度推理大模型等解决实际业务痛点。团队鼓励创新,勇于探索及突破前沿AI能力边界。 1.负责foundation model和生成式AI智能体构建,追踪业界文本生成、思维学习、内容理解等方向的最新技术,极致优化预训练、微调、领域知识注入、RLHF、RM、AI可解释能力。 2.负责AI技术前沿技术跟踪、创新和落地,例如,利用意图理解、图文理解等构建新一代的生成式审核机器人与辅助系统,运用反馈标注、知识体系建设、知识图谱构建等任务;利用多模态技术对图像、文本、结构化数据进行融合学习,致力于挖掘风控场景问题并全面提升风险运营效率,并帮助实现对合规、欺诈、洗钱等风险的高效管控。 3.深入跟踪调研前沿技术方向 ,包括但不限于 NLP/CV/多模态/智能体等,并适时进行技术分享。推动相关领域技术创新,进行专利申请和学术文章发表,产出至少一篇CCF-A以上论文。

上海