阿里巴巴1688技术部-LLM算法工程师-AI
任职要求
1.计算机科学、人工智能或相关专业本科及以上学历,并且对AI有着大量的热情; 2.具有AI模型开发经验,熟悉至少一种深度学习框架(如TensorFlow、PyTorch); 3.精通Python编程语言,了解C/C++或Java等其他编程语言者优先; 4.…
工作职责
业务描述:中国跨境电商发展迅速、空间巨大,1688基于自身在源头厂货和供应链上的优势,面向未来打造以AI为驱动的去中心化的新一代数字化供应链体系,重塑中国跨境电商整个上下游的产业链条,一端从用户需求出发构建跨境电商垂直领域的通用Agent,连接和赋能传统行业SaaS,成为AI时代的卖家经营入口;一端从供应链的源头出发打造全球数据全、准确率高、趋势感知强的商机Agent,通过商机调度整个供应链系统,并逐步将选品、寻源、组货、跟单Agent化,构建AI驱动的数字化供应链系统。 具体范围: 1.基于跨境业务在基础LLM的模型上蒸进后训练工作,同时提供面向Agents研发模式下的,大模型算法数据+测评技术工作; 2.基于电商用户的B类需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试,不限于AIGC素材、多语言智能客服、AI选品工具等核心AI能力建设。
1、负责AIOps领域算法和解决方案设计实现,包括时序分析、日志挖掘、故障预测、根因关联推断和智能决策等; 2、探索LLM x AIOps的落地应用,包括但不限于异常检测、根因定位、止损容灾等场景; 3、持续跟进LLM前沿技术、开源方案及其在AIOps领域的应用。
阿里国际站是全球Top的跨境B2B数字贸易平台,致力于推动跨境电商发展。我们正在寻找对LLM技术充满热情并希望将其落实到实际业务中同学,加入我们的LLM算法团队。我们拥有业界为数不多已实现大规模商业化并持续快速增长的AI产品,团队在LLM领域的多项研究成果也已在WWW、AAAI、CVPR、SIGIR等顶级学术会议上获得认可。 1、参与大模型的开发与应用,包括训练数据构造、模型微调、模型评估等,支持阿里巴巴跨境B2B电商业务的各类AI产品需求。 2、负责设计、开发、完善和优化AI生成的Prompt。 3、参与AI Agent技术开发,结合知识库构建、检索增强、数据分析等。 4、根据业务特点,紧跟大模型发展趋势,探索新技术新方法解决实际问题。
背景介绍: 我们正在构建一个深度理解淘宝研发上下文的领域大模型,目标是打造一个具备“架构师级”洞察力的AI模型,从根本上提升研发效率与质量。如果你渴望在一个真实、复杂的场景中,将LLM的能力推向新的高度,并亲手塑造下一代软件研发的未来,我们期待你的加入! 1. 领域模型训练: 负责淘宝研发领域大模型的核心算法,主导持续预训练(Continual Pre-training)、指令微调(SFT)和对齐(RLHF/DPO)等训练流程; 2. 知识注入与推理: 设计并实践创新的数据方案,将代码、文档、配置等异构研发知识高效注入模型;通过多任务学习、FIM等范式,增强模型对软件工程的深度理解与复杂推理能力; 3. 能力评估与迭代: 建立科学的评测体系,精准评估模型在代码溯源、影响分析、故障排查等高阶任务上的能力;分析bad case,驱动数据和算法的闭环优化。