阿里巴巴1688技术部-大模型应用与研发-算法
任职要求
1.计算机科学、人工智能或相关专业本科及以上学历,并且对AI有着大量的热情; 2.具有AI模型开发经验,熟悉至少一种深度学习框架(如TensorFlow、PyTorch); 3.精通Python编程语言,了解C/C++或Java等其他编程语言者优先; 4.…
工作职责
技术团队介绍 我们致力于打造业界领先的大模型算法应用架构团队,推动AI技术在产业互联网的深耕落地,重塑新一代数字化供应链系统和产业带智能工厂生态,构建下一代1688互联网产品技术形态。在这里你将收获: 1.深耕大模型算法的核心技术,探索前沿的算法架构设计,推动技术的创新与突破; 2.与顶尖团队协作,共同解决实际场景中的复杂问题,让技术真正落地并产生影响; 3.在快速发展的AI领域中,获得广阔的成长空间和职业发展机会,成为技术领域的引领者。 具体工作范围 1.负责1688LLM的模型蒸馏和二次训练基础算法工作,同时提供面向Agents研发模式下的,大模型算法数据+测评技术工作; 2.结合业务需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试; 3.基于产业智联的工厂、设计师、物流团队等多生态角色,构建基于平台调度的AI协同履约能力,打造产联业务新产技创新产品;
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。
我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。