通义通义实验室-算法专家-Multi-Agent
社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘
任职要求
1、 硕士以上学历,在以下方向至少有一年的科研或工作经历:自然语言处理、多智能体系统、搜索推荐广告等大规模机器学习应用、强化学习应用、机器学习平台、机器学习理论。有独立项目落地、ML顶会论文、算法竞赛获奖等经历优先。 2、 动手能力强、代码基本功扎实,责任心强、擅长团队合作与沟通。
工作职责
团队介绍: 通义实验室-智能计算实验室-智能系统研究组,致力于机器学习、机制设计、数据处理与数据库等学科技术的研究和落地,有完善的产学研结构,算法研究与业务创新并重。团队成员皆毕业于国内外知名高校。团队过去几年在机器学习、数据库等领域顶级会议发表论文近百篇,并曾获SIGKDD 2022最佳论文奖。当前团队致力于大语言模型领域的高质量数据生产与行业应用创新,诚邀各路英才加盟。 职位描述: 团队主要聚焦于大语言模型(LLM)技术,我们期待你的工作覆盖一下至少一个技术方向: 1、LLM预训练数据的生产,包括高效数据清洗、高质量问答或者COT数据的生成等新兴方向。 2、RLHF微调技术:根据设定的alignment调优目标,探索并应用RLHF类算法。 3、Multi-agents协作系统:以LLM agents应用后链路处理工具,打造多智能系统以及相关应用。 4、LLM工程链路及优化:Megatron框架、数据处理框架、推理部署等。 5、LLM行业应用:结合行业属性,收集数据并设计算法,深度探索LLM在垂类下的优化空间。 6、LLM中的机器学习理论:针对LLM全链路的各类算法各类算子以及分布式框架,探索相应的优化理论。 工作内容: 1、 前沿技术研究:在以上技术方向上,寻找有价值的科研问题,在算法、系统、理论等方向开展前沿研究工作,发表高质量有影响力的论文及专利,并对业务产生积极作用。 2、 业务创新与落地:结合行业大模型领域的核心客户需求,设计并完善行业大模型相关技术框架,并持续优化迭代,为行业线提供有创新性的各类算法解决方案。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
智能体+
https://learn.microsoft.com/en-us/shows/ai-agents-for-beginners/
In this 10-lesson course we take you from concept to code while covering the fundamentals of building AI agents.
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
社招3年以上技术类-算法
1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。 2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。 3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。
更新于 2025-07-28
社招3年以上技术类-算法
团队介绍: 数字支付智能技术团队,专注于支持支付业务的增长(包括线下支付和线上支付)。该职位主要聚焦于支持线下“碰一下”的支付和数字化业务场景,涵盖支付C端增长和支付B端增长,通过算法应用帮助业务提升效率并贡献增量价值,共同创造新的“碰一下”创新赛道。 职位描述: 方向一:大模型技术研发与场景落地基于大模型构建支付场景智能化解决方案(营销策略生成、Multi-Agent协作系统、RAG知识问答等)开发面向支付业务的领域大模型,优化模型推理效率与场景泛化能力 方向二:多模态数据融合与价值挖掘通过多模态技术实现商户POI识别、经营画像构建与场景理解构建跨模态检索与生成系统,提升支付生态数据利用率
更新于 2025-08-24
社招
1. 负责LLM及智能体(Agent)方向的研究,为室内智能设计提供创新解决方案; 2. 深入研究最新的论文和研究成果,调研与跟进业界最新进展,跟进SFT、RLHF等技术,探索LLM在电商导购场景的应用 3. 推进LLM模型在家装搭配导购场景的应用:设计基于LLM的技术链路,涵盖数据体系、reasoning能力、效果评估和高效推理能力
更新于 2025-06-12