阿里巴巴研究型实习生-业务技术-AI Agent应用算法实习生(SRE根因分析)
任职要求
1. 计算机科学、人工智能、数学、统计学或相关专业硕士及以上学历,博士或有国际顶会论文发表者优先。 2. 精通Python,熟悉PyTorch深度学习框架,对LLM、Agent领域有深入研究,有AI Agent相关研发经验(如多智能体协作、决策优化、强化学习与SFT结合等)。 3. 了…
工作职责
1. 探索基于强化学习的智能运维(SRE)Agent技术,通过模拟复杂故障场景训练决策策略,构建具备根因诊断、自主决策的智能系统,结合推理规划、多轮工具调用、因果推断与反事实推理等前沿技术,推动运维智能化的突破性进展。 2. 参与核心算法设计与系统开发,探索结合因果建模与反事实推理方法,解决动态环境下的根因诊断与决策优化问题。 3. 基于真实生产数据或开源数据集,搭建故障模拟环境并定义多维度奖励函数,实现多轮工具调用能力(如日志分析、指标监控、配置管理API),构建端到端的智能运维原型系统,设计对比实验评估Agent性能,撰写技术报告并参与论文或专利撰写。
1. 参与基于AI Agent的智能运维系统研发,通过多监控指标的时序预测与自适应阈值动态建模技术,构建高效、精准的故障发现与预警体系,支撑企业级运维场景的智能化升级。 2. 探索端到端的AI算法解决方案,提升故障预测的灵活性与准确性。 3. 探索开发基于AI Agent的多监控指标时序预测方案,融合文本、日志、指标等异构数据,实现跨模态特征提取与动态关联分析。 4. 构建自适应阈值动态建模框架,结合在线学习与强化学习技术,实现阈值随业务负载与环境变化的实时调整。
1. 设计并优化职能Agent架构,包括但不限于内部业务知识利用,Agent记忆、上下文工程、工具调用、多智能体协作等,打造AI数字员工,提升职能团队整体工作效率。 2. 参与Agent模型训练过程,包括业务场景相关的SFT数据合成、Agentic RL等,设计高效的策略优化算法,结合私域知识、公域知识、历史经验等信息,通过稳定的Agentic RL,提升Agent多轮交互能力,实现AI数字员工与职能团队的协作效率提升,撰写顶会论文并进行业务落地。
业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将运用大模型、强化学习、深度学习等先进技术处理海量数据,推动用户体验优化与平台效率提升,主要包括: 1. 行程问题智能处理:构建并优化模型,识别司乘纠纷、费用异常、服务质量波动、安全风险、客诉等多类行程问题,并实现自动化处理方案。 2. 前沿技术落地:将多模态大模型及相关技术(PE、SFT、DPO、RAG、AI Agent、Agentic RL、AIGC 等)应用于业务场景,显著提升算法效果与业务指标。 3. 问题建模与解决:将业务场景中的复杂问题抽象为数据建模或科学研究课题,提出可行解决方案并高质量落地。 在这里,你的算法将直接服务全国数亿级用户,带来真实而深远的影响;你能接触到前沿大模型、多模态、强化学习等核心技术,并与顶尖同事共创,在开放包容的创新氛围下,发挥AI创造力。
团队介绍: 我们团队负责高德出行大数据的分析和应用开发,在机器学习、深度学习、大模型agent等方向探索解决业务问题,洞察业务机会,打造智能化的用户出行数据引擎。我们鼓励创新,鼓励发表论文和申请专利,乐于用新技术在业务方向做实际落地的尝试,期待你的加入! 具体职责包括但不限于: 1、负责机器学习、深度学习领域的数据挖掘研发工作,应用高德人地时空大数据挖掘用户画像、解决用户痛点问题; 2、负责时空大数据与AI Agent结合的应用实践,探索时空大数据Agent落地时间; 3、针对特定的业务场景对基座大模型进行微调优化,实现专属技能模型的能力升级和性能提升。