阿里巴巴业务技术-大模型算法专家-Agent方向
任职要求
1. 计算机相关专业本科及以上学历,研究方向为自然语言处理、机器学习、深度学习等相关方向,或者在该领域有相关工作经验,精通Python编程,熟悉Java/C++中至少一门语言 2. 能够从复杂的业务场景中进行问题抽象、算法选型、算法优化以及不断提升效果,有较强的自我驱动力; 3. 了解阅读理解、序列标注、文本生成、文本分类等传统NLP任务,精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发流程 …
工作职责
1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力 2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料; 4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
1. 负责LLM及智能体(Agent)方向的研究,为室内智能设计提供创新解决方案; 2. 深入研究最新的论文和研究成果,调研与跟进业界最新进展,跟进SFT、RLHF等技术,探索LLM在电商导购场景的应用 3. 推进LLM模型在家装搭配导购场景的应用:设计基于LLM的技术链路,涵盖数据体系、reasoning能力、效果评估和高效推理能力
淘天物流算法团队致力于解决电商场景下物流、供应链全链路的算法模块优化,包括预测、商品物流属性生成、小件员物流照片稽核、运营区规划、闪购场景下的补货、调拨等等。 职位描述 1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天物流领域知识,打造物流垂域agent,支撑toB、toC等多场景应用,包括但不限于 退货助手、淘宝万能搜(物流场景)、闪购供应链agent等 4. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。
1、通过Agent的算法架构设计、上下文工程、RAG、Memory优化,Policy生成、LLM post training等方法,提升【店铺AI导购机器人】回复的准确性和专业性,打造导购机器人行业标杆。 2、通过数据挖掘和分析找到用户在使用店铺AI导购机器人过程中的不良体验,找准算法优化的方向或形成对产品改进的建议。 3、通过优化模型尺寸、优化缓存技术等,降低离线训练成本和线上推理成本,提升回复的速度。 4、技术上探索智能体自进化(Self-Evolving)与终生学习(Lifelong Learning)的实现路径。