阿里巴巴阿里国际站-大模型算法工程师-AI SaaS算法团队
任职要求
1.计算机、数学或统计相关专业硕士及以上,有扎实的计算机知识和NLP功底。 2.深入理解GPT系列/LLaMA系列/Qwen系列等LLM的算法原理,熟悉LLM训练数据构建方法,包括预训练数据的比例、SFT…
工作职责
阿里国际站是全球Top的跨境B2B数字贸易平台,致力于推动跨境电商发展。我们正在寻找对LLM技术充满热情并希望将其落实到实际业务中同学,加入我们的LLM算法团队。我们拥有业界为数不多已实现大规模商业化并持续快速增长的AI产品,团队在LLM领域的多项研究成果也已在WWW、AAAI、CVPR、SIGIR等顶级学术会议上获得认可。 1、参与大模型的开发与应用,包括训练数据构造、模型微调、模型评估等,支持阿里巴巴跨境B2B电商业务的各类AI产品需求。 2、负责设计、开发、完善和优化AI生成的Prompt。 3、参与AI Agent技术开发,结合知识库构建、检索增强、数据分析等。 4、根据业务特点,紧跟大模型发展趋势,探索新技术新方法解决实际问题。
业务描述:中国跨境电商发展迅速、空间巨大,1688基于自身在源头厂货和供应链上的优势,面向未来打造以AI为驱动的去中心化的新一代数字化供应链体系,重塑中国跨境电商整个上下游的产业链条,一端从用户需求出发构建跨境电商垂直领域的通用Agent,连接和赋能传统行业SaaS,成为AI时代的卖家经营入口;一端从供应链的源头出发打造全球数据全、准确率高、趋势感知强的商机Agent,通过商机调度整个供应链系统,并逐步将选品、寻源、组货、跟单Agent化,构建AI驱动的数字化供应链系统。 具体范围: 1.基于跨境业务在基础LLM的模型上蒸进后训练工作,同时提供面向Agents研发模式下的,大模型算法数据+测评技术工作; 2.基于电商用户的B类需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试,不限于AIGC素材、多语言智能客服、AI选品工具等核心AI能力建设。
1. 负责基于大语言模型的智能交互及赋能产品的搭建及在美团SaaS场景的应用落地,包括但不限于智能助手、智能营销、推荐系统、智能客服、AI BD、AI Search、AI Testing等; 2. 负责大型语言模型的微调、偏好对齐、知识增强等技术探索,跟踪国内外前沿的大模型技术动态,持续改进和优化现有模型; 3. 有机会负责创新AI功能端到端的开发,需要全方位地思考问题,能够在机器学习技术栈中承担不同角色,解决各个环节问题;
1. 平台推广与用户增长: 负责图灵AI应用平台核心产品/能力的运营策略制定与执行,包括客户理解与分析、运营推广计划等,提升平台在目标用户中的认知度和活跃度。 2. 应用场景挖掘与孵化: 深入理解各业务方需求及AI技术能力边界,主动挖掘和识别AI技术在不同业务场景下的潜在应用机会,与业务团队共同设计和验证AI解决方案,并推动成功落地。 3. 技术价值传递与赋能: 作为平台技术与业务应用之间的桥梁,清晰、准确地向业务方传递AI能力价值,组织产品培训、案例分享等活动,赋能用户更好地理解和使用平台AI能力。 4. 运营体系建设与优化: 建立和完善AI应用的效果评估标准、反馈机制和运营SOP;针对特定AI应用场景,协助构建或优化评测数据集和评估方法。 5. 数据驱动运营与迭代: 负责平台产品/能力的数据运营工作,监控产品运营数据(如调用量、采纳率、用户反馈、效果指标等),通过数据分析评估应用效果,驱动产品迭代和运营策略优化。 6. 跨团队协作与沟通: 与算法、研发、产品设计及业务团队紧密协作,确保信息畅通,高效推动AI应用项目的进展和目标达成;收集、整理并向产研团队反馈用户需求和市场动态。 7. 生态与内容建设: 负责整理和输出平台产品化文档、最佳实践案例、行业解决方案等内容,助力构建活跃的开发者和用户生态。