logo of alibaba

阿里巴巴阿里妈妈-AI Agent算法工程师-北京/杭州

社招全职2年以上地点:北京 | 杭州状态:招聘

任职要求


1、计算机科学、人工智能、数学等相关专业的硕博学生,或有丰富的AI、LLM相关实践经验,在人工智能相关顶会发表过论文者优先;
2、强悍的编码能力,熟练掌握PythonCpp以及TF、Pytorch等语言,具备独立实现论文中算法的能力;有基于低代码平台构建agent经验,或擅长Vibe Coding的优先;
3、抗压能力强;具备良好的沟通表达能力、数据驱动的分析能力,以及面向具体业务问题出色的问题定义和抽象能力;
4、对于AI产品有热情与好奇心,深度参与过AI Native产品研发,或对AI原生应用有独到见解;
5、熟悉LLMAgent相关算法 尤其是在基于RL的任务规划、推理能力上有研究或实践者优先。

工作职责


1、支持阿里妈妈广告产品平台上AI Agent相关算法能力设计和优化;
2、构建完善与科学的营销智能体评价体系,持续优化现有Agent产品的产品能力与交互体验效果,打造行业Agent标杆;
3、通过Agent的算法架构设计、上下文工程、Memory优化,Policy生成、LLM post training等方法,持续提升领域内LLM的Planning与Reasoning能力;
4、构建基于agentic RL的营销智能体,优化营销环境模型与反馈模型,设计高效的RL训练方法;
5、探索智能体自进化(Self-Evolving)与终生学习(Lifelong Learning)的实现路径;
包括英文材料
大模型+
Python+
C+++
PyTorch+
算法+
AI agent+
相关职位

logo of alibaba
社招1年以上

联盟算法团队依托淘宝联盟和淘宝内容营销,以先进的机器学习和AI技术驱动站外十亿级消费者的电商营销场景发展。淘宝联盟是百万淘客在站外的商品分发,实现淘宝千万级用户引流,十亿级GMV规模的站外营销生态;淘宝内容营销是基于万级内容创作者生产的内容以及站外媒体投放,为商家提供站外种草价值的广告营销生态。 我们根据淘宝联盟生态的特点,基于海量时空传播图网络,构建先进的多Treatment价量关系等营销算法模型,实现智能化选品,出价,发券系统;在程序化流量中,深耕多场景多目标预估、个性化排序模型和匹配策略。在淘宝内容营销场景下,我们从内容企划,自动化投放,价值评估全链路实现智能化,涉及站外趋势预测,智能选品,增量目标下的人群挖掘,细粒度的多触点增量预估与评估等技术。在不断提升业务效果的同时,我们在AI算法方面不断突破技术边界:基于强化学习的多模态大语言模型的端到端多模态表征技术,基于LLM大语言模型的智能文案,营销AI agent等技术,广泛应用在同款比价,内容理解,选品出价等场景。 热忱欢迎对营销算法,搜推广,计算机视觉和大语言模型等方向感兴趣的同学加入我们,一起加油,共同成长!我们坚信你的加入,是我们彼此优秀的开始。

更新于 2025-10-13
logo of alibaba
社招

1、参与电商大模型智能体产品研发,包括框架设计、算法开发、迭代优化等 2、根据业务产品形态对大模型进行post training(SFT/RLHF等)优化、结构优化、prompt engineering等 3、基于LLM的机器人AI Agent模块与产品其他功能模块交互的工程实现 4、跟进大模型智能体前沿技术趋势,结合实际业务需求,将技术应用到实际业务场景

更新于 2025-04-17
logo of quark
校招智能信息秋季20

夸克智能体团队致力于建设高度自主的大规模 AI Agent 系统,基于领先的工程基础与业务生态,已实现多领域多模态智能体的落地应用,在 AI 搜索、医疗健康、知识问答、智能创作、办公效率等核心场景形成深度应用。 我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,您将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品。

更新于 2025-08-13
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-08-18