阿里巴巴智能算法产品事业部-算法工程师-AIGC多模态方向-AI原生-视觉智能
任职要求
【必备项】 1. 深入理解AIGC核心技术原理,涵盖扩散模型(Stable Diffusion、Flux、Qwen等)、自回归生成及多模态理解等方向,具备图像/视频生成、编辑或多模态相关项目的完整落地经验; 2. 工程实现能力扎实,熟练掌握Python/C++至少一门语言,熟悉PyTorch等主流深度学习框架,具备从算法原型到生产部署的全流程开发能力; 3. 对生成式AI保持…
工作职责
1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。
依托淘宝、天猫超大规模商业场景,我们致力于通过最前沿的多模态大模型技术驱动万亿级交易额的增长。在这里你将面对业界最复杂的电商图文、视频语境,与顶尖团队一起探索 AIGC 与多模态技术在搜索广告全链路(召回、排序、创意生成)的深度融合与变现。包括并不限于: 1. 负责电商多模态统一表征: 构建面向海量商品、直播、短视频的超大规模预训练模型(VLM),解决多模态语义对齐、细粒度特征提取及跨模态检索难题。 2. 负责生成式广告物料(AIGC): 探索 Diffusion Model、LLM 在广告创意自动生成(文案、头图、视频步进)中的应用,提升物料投放质量与点击转化率。 3. 负责多模态驱动的商业决策: 将多模态感知能力深度注入广告全链路(从搜索词理解到广告 CTR/CVR 预估),实现从“看懂图片”到“理解意图”的决策升级。 4. 负责全链路多物料优化: 针对商品、直播间、短视频等多类型物料,设计统一的跨模态排序算法,优化搜索场景下的多元流量分配效率。 5. 负责视觉底层技术创新: 针对电商复杂场景,优化 OCR、商品检测、度量学习及视觉搜索等经典任务,建立行业领先的视觉基座。
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 1. 核心模型研发与创新: 负责淘宝主搜的核心算法研发,主导设计和优化面向电商场景的相关性大模型。重点投入Agentic Search、多模态(文图、视频)相关性、AI生成式搜索等前沿方向,从模型层面根本性地提升搜索相关性、用户体验和商业效率。 2. 电商知识资产构建: 主导构建电商领域的高质量多模态数据飞轮。通过知识库建设、主动学习、数据挖掘和智能标注等手段,持续迭代和优化数据质量,为大模型的训练和迭代提供核心“燃料”,沉淀公司级的电商知识数据资产。 3. 用户体验洞察与度量: 深入理解和洞察电商搜索场景下的用户意图与行为模式,建立并完善一套科学的、数据驱动的搜索体验分析与评估方法论。以量化指标和用户反馈指导模型迭代方向,确保技术创新最终服务于用户价值。 4. 前沿技术探索与应用: 密切追踪LLM(大语言模型)、MLLM(多模态大模型)、NLP、AIGC等领域的最新技术进展。快速进行技术预研、验证,并将其创造性地应用于电商搜索业务中,解决实际问题。在应用基础上进行技术创新,鼓励发表高水平论文、申请技术专利,构建团队在行业内的技术影响力。 我们提供 1. 高空间的舞台: 真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥。 2. 前沿的技术挑战: 直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题。 3. 充足的资源支持: 丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围。 4. 清晰的成长路径: 完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。
我们是阿里妈妈搜索广告算法团队,负责淘宝搜索场景广告技术变现的算法设计和优化,包括并不限于: 1. 负责研究多模态大模型在淘宝海量图文、视频物料理解上的运用; 2. 负责研究生成式大模型/AIGC算法在广告投放物料挖掘上的运用; 3. 负责研究多模态大模型和生成式大模型在搜索广告中的全链路运用和升级; 4. 负责研究搜索广告场景下多物料投放算法的设计和优化,包含商品、直播、短视频等; 5. 负责研究超大规模多模态大模型的训练和推理加速; 6. 负责研究经典CV/多模态任务的设计和优化,包括分类、检测、OCR、度量学习等。
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 1. 负责大语言模型和多模态大模型在电商内容生成场景的算法研发,包括但不限于进行指令微调(Supervised Instruction Tuning),以增强模型遵循指令生成特定格式和风格内容的能力 。 2. 运用生成式AI技术,为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要,并探索文生图等多模态技术以创造全新的商品展示图像。 3. 建立科学的内容质量与业务效果评估体系,负责对算法模型进行评估和改进,通过A/B实验等方式量化分析生成内容对业务指标的影响,持续推动算法创新与迭代。 4. 与产品、工程及业务团队紧密合作,深刻理解业务需求,推动算法技术转化为实际的产品解决方案,确保技术成功落地。 5. 跟踪并研究大模型领域的前沿技术进展,结合业务需求制定研发方案,探索AI Agent、RAG等技术在电商搜索场景的创新应用。 我们提供 1. 高空间的舞台: 真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥。 2. 前沿的技术挑战: 直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题。 3. 充足的资源支持: 丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围。 4. 清晰的成长路径: 完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。