logo of alibaba

阿里巴巴业务技术-大模型算法专家-Agent方向

社招全职3年以上地点:杭州状态:招聘

任职要求


1. 计算机相关专业本科及以上学历,研究方向为自然语言处理机器学习深度学习等相关方向,或者在该领域有相关工作经验,精通Python编程,熟悉Java/C++中至少一门语言
2. 能够从复杂的业务场景中进行问题抽象、算法选型、算法优化以及不断提升效果,有较强的自我驱动力;
3. 了解阅读理解、序列标注、文本生成、文本分类等传统NLP任务,精通PythonPyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发流程
4. 深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChainAutoGenAgent开发框架,有完整智能体系统搭建经验者优先
5.有代码生成/知识图谱构建/智能问答系统/图计算等相关项目背景优先
6.了解DeepspeedMegatron-LM等分布式训练框架,并有一定的多机多卡分布式训练与debug经验优先
7. 在ACL、EMNLP、KDD、SIGIR、ICMLICLR、NeurlPS等相关顶会有论文发表者优先

工作职责


1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力
2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测;
3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料;
4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力;
5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
包括英文材料
学历+
NLP+
机器学习+
深度学习+
Python+
Java+
C+++
算法+
PyTorch+
TensorFlow+
Llama+
Transformer+
SFT+
Prompt+
LangChain+
AutoGen+
AI agent+
开发框架+
智能体+
DeepSpeed+
Megatron+
ICML+
相关职位

logo of alibaba
社招

1. 负责LLM及智能体(Agent)方向的研究,为室内智能设计提供创新解决方案; 2. 深入研究最新的论文和研究成果,调研与跟进业界最新进展,跟进SFT、RLHF等技术,探索LLM在电商导购场景的应用 3. 推进LLM模型在家装搭配导购场景的应用:设计基于LLM的技术链路,涵盖数据体系、reasoning能力、效果评估和高效推理能力

更新于 2025-06-12
logo of alibaba
社招2年以上

1、通过Agent的算法架构设计、上下文工程、RAG、Memory优化,Policy生成、LLM post training等方法,提升【店铺AI导购机器人】回复的准确性和专业性,打造导购机器人行业标杆。 2、通过数据挖掘和分析找到用户在使用店铺AI导购机器人过程中的不良体验,找准算法优化的方向或形成对产品改进的建议。 3、通过优化模型尺寸、优化缓存技术等,降低离线训练成本和线上推理成本,提升回复的速度。 4、技术上探索智能体自进化(Self-Evolving)与终生学习(Lifelong Learning)的实现路径。

更新于 2025-09-12
logo of quark
社招5年以上技术类-算法

主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。

更新于 2025-10-13
logo of alibaba
社招3年以上

商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。

更新于 2025-10-15