顺丰自然语言处理工程师(博士后)
任职要求
1.博士学历,具备优秀的沟通能力,学习能力,有强烈的上进心和主动性; 2.熟练使用C++/Java/Python,熟悉Pytorch和TensorFlow等框架; 3.熟悉或精通基于预训练+微调的方式完成NLP模型优化,并解决实…
工作职责
1.负责相关领域的数据收集、清洗、送标、微调、效果评估工作; 2.负责大模型相关算法的设计、调试并训练,包括但不限于GPT、Llama、baichuan等模型训练、SFT、RLHF及相关Prompt Engineering; 3.使用向量数据库、langchain、大模型构建大模型应用服务,构建并持续完善大模型算法流水线; 4.跟进前沿技术发展,结合业务场景引进行业先进实践,保障技术先进。
团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.聚焦前沿大模型技术在电商场景的应用与创新,推动商品理解领域的智能化转型; 2.负责大模型算法的研究、优化及落地实施,涵盖大模型后训练、领域专用大模型、多模态大模型、RAG、Agent等前沿技术; 3.针对电商场景,探索并实现大模型在商品属性挖掘以及抽取,结合搜索及商家服务等环节中的应用,全面提升搜索体验与运营效率; 4.深入挖掘行业数据特性,与产品及研发团队紧密协作,将技术成果转化为实际产品竞争力。
1、负责代码、文本、多模态等数据的合成技术的研究与开发,运用大模型和先进算法,生成高质量、多样化的合成数据,扩充数据规模与多样性,满足大模型训练需求; 2、对大模型训练数据进行深入分析,运用统计学、机器学习等方法挖掘数据特征和规律,识别数据中的噪声、偏差和潜在问题,为数据合成、标注和质量过滤提供数据洞察和优化方向; 3、研究并实现高效的数据自动标注算法,结合自然语言处理、计算机视觉等技术,开发自动化标注工具和流程,提升标注效率和准确性,降低人工标注成本; 4、设计并优化数据质量评估指标和过滤算法,建立数据质量监控体系,对原始数据、合成数据和标注后的数据进行全面质量检测和筛选,确保输入大模型的数据真实、准确、合规; 5、持续跟踪行业前沿数据技术动态,对现有数据处理算法和流程进行优化升级;产品、工程等团队紧密协作,推动数据处理技术在大模型研发和应用中的高效落地。
团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题介绍: 背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。 研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。 1、开发AI驱动的智能客服系统:设计并实现AI对话式客服助手,能够处理电商咨询、投诉、退款、争议解决及物流相关问题,以AI替代传统人工客服; 2、大语言模型(LLM)后训练与高效学习:应用最前沿的LLM训练优化技术,如指令微调、强化学习、持续学习等,在最少标注数据的情况下优化AI客服响应质量;具备大语言模型(LLM)微调、知识蒸馏或强化学习的相关经验,应用于对话式AI场景;深入理解检索增强生成(RAG)、专家混合模型(MoE)、稀疏注意力、强化学习、推理时间优化等技术,以提升AI对话质量; 3、基准测试与训练数据构建:识别具有挑战性的客服交互场景,如政策解读、争议处理、客户投诉、导购推荐等,并构建专门的测试集和训练集; 4、多语言与跨文化客服支持:构建能够适应多语言和不同文化背景的AI模型,确保客服交互的精准翻译和针对不同用户群体的合适响应;精通多语言自然语言处理(NLP)、机器翻译及跨语言对话建模; 5、模型优化与高效部署:研究模型压缩、量化、推理优化等技术,确保AI客服助手在大规模应用场景下具备低延迟、高可靠性的表现。
以大模型对话技术为核心,探索前沿技术问题,研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手,实现“技术驱动业务范式”的升级转变,最终助力商业价值全面提升。 研究方向一:Agent能力增强 基于Agent的用户助理,研究提升Agent自主规划能力,并通过Agent构建和基于后训练的优化,实现数字助理的能力复刻和增强。 研究方向二:强化学习算法研究 参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。 研究方向三:垂域模型定制化构建 领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。 研究方向四:精准上下文理解与长程依赖建模 研究如何高效、准确地捕获和利用复杂的项目级上下文信息(如整个代码库、依赖关系、API文档、Issue跟踪等),探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法,以支持更精准、更全局的代码智能,从而提升业务研发在存量代码中迭代的效率。