阿里巴巴淘天算法技术-商品内容理解算法专家(LLM/VLM)-北京/杭州
任职要求
1. 计算机、人工智能、模式识别等相关专业硕士及以上学历,3年以上相关工作经验。 2. 具备以下一个或多个领域的深厚积累: a. 大模型(LLM): 熟悉主流大语言模型的原理,在Prompt Engineering、Fine-tuning、RAG、Agent等方向有深入的实践经验,主导过基于LLM的信息抽取、文本生成、语义理解等项目。 b. 多模态大模型(VLM): 熟悉主流多模态大模型的原理和应用,有丰富的图文匹配、跨模态生成、VQA、视觉内容理解等项目经验。 c. 商品理解/知识图谱: 在电商领域,有深厚的商品属性体系构建、内容理解、知识图谱建设等相关经验,对电商商品数据有深刻洞察。 3. 具备扎实的编程与工程能力,具备优秀的算法实现能力和代码功底,精通Python/C++/SQL等编程语言,熟练掌握PyTorch等至少一种深度学习框架。 4. 具备优秀的分析与解决问题能力,能够将复杂的业务问题抽象为清晰的算法问题,并给出创新性解决方案。 5. 拥有强烈的技术Owner意识和自驱力,能够独立负责一个或多个技术方向的规划与落地。 加分项: 1. 在CVPR, ICCV, NeurIPS, ICML, ACL, EMNLP等顶级AI会议上有论文发表者。 2. 有电商搜索/推荐/广告相关领域算法经验者。 3. 有知名开源项目贡献或在Kaggle等数据竞赛中取得优异成绩者。
工作职责
商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
我们是饿了么到家搜推算法团队,负责淘宝闪购、支付宝闪购、饿了么APP搜推场景的算法迭代,业务领域包括餐饮、零售、医药,核心方向包括:搜推场景下的召回排序、图文视频素材生成、素材优选智能展示等,具体方向细分为如下: 1、搜推系统:Query理解、召回优化(语义/多模态/个性化)、排序算法(粗排/精排/重排)的迭代; 2、文本素材:推荐理由生成、商品标题优化、商品卖点挖掘、解释性内容生成&召回优选; 3、智能创意:图片美化、图文/图图自适应合成、文本生成图片、动图视频生成&召回优选; 4、趋势热点:实时趋势、周期趋势及未来趋势的感知及内容建设,赋能业务; 5、跟踪算法领域的前沿技术动态,结合搜推业务进行技术引入和产品创新。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法在国际化电商场景的落地与提升,提升亿级用户搜索体验; 2、参与国际化电商搜索算法的优化与迭代,提升转化效率、用户体验和供给生态;解决多语言相关性匹配、权威性感知、种草内容理解、重复铺货、山寨假货治理等技术难题,极致优化内容电商、传统货架电商等多种电商业务形态的基础搜索质量;极致提升商品、种草视频和带货直播的购物转化效率,促进GMV增长; 3、深入参与核心搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升电商搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法在国际化电商场景的落地与提升,提升亿级用户搜索体验; 2、参与国际化电商搜索算法的优化与迭代,提升转化效率、用户体验和供给生态;解决多语言相关性匹配、权威性感知、种草内容理解、重复铺货、山寨假货治理等技术难题,极致优化内容电商、传统货架电商等多种电商业务形态的基础搜索质量;极致提升商品、种草视频和带货直播的购物转化效率,促进GMV增长; 3、深入参与核心搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升电商搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。