阿里巴巴AI Business-多模态算法专家-杭州/北京
任职要求
职位要求 1. 本科及以上学历,机器学习、CV、NLP等相关专业,有扎实的理论基础和实践经验; 2. 具备扎实的数据结构、算法和编码能力,精通至少一种编程语言,如C/C++/JAVA/Python等,有ACM-I…
工作职责
1. 针对多模态大模型设计和优化强化学习算法,参与多模态强化学习训练流水线实践,提升模型在数学、通用推理、模糊偏好、多模态deep research应用于业务上的表现; 2. 关注行业内顶尖机构在多模态大模型RL、MoE大模型RL、deep research等方向的最新算法成果,能够基于前沿研究提出有效方法解决关键性问题 3. 通过良好的对内对外沟通协作能力,和团队配合共同推进自研多模态大模型在各个业务场景落地。
1. 探索大模型/多模态模型预训练、指令微调、模型评估等技术。 2. 探索提升文本大模型/多模态模型推理能力的前沿技术。 3. 结合阿里巴巴国际业务场景,与产品和运营团队协作,推动大语言模型/多模态模型在各类业务中的应用。
阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门;自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型-Ovis,依托全球化的AI基础设施和算力资源,帮助AliExpress、Lazada、阿里巴巴国际站、Trendyol、Daraz 等平台全面革新跨境电商全链路的经营体验和商业效率;目前已服务超50万商家,平均日调用量已突破10亿次,覆盖营销、客户服务、商品发布、设计、合规等60+应用场景;正在基于自研的大模型与工程技术,打造新一代的智能体(Agent)和智能引擎(Deep Research)产品,持续致力于让全球商业没有语言障碍,用智能帮助跨境贸易更加简单。 该职位负责构建高性能、可扩展的搜索引擎工程架构,优化搜索效果,支持多模态搜索能力,打造行业领先的搜索产品; 工作职责 1、负责搜索引擎相关系统研发,打造高性能、低成本、多场景的搜索产品 2、设计并实现搜索系统分布式架构,确保系统的高可用性、高性能和可扩展性 3、构建支持多模态(文本、图像、视频)检索的搜索系统架构,推动多模态搜索能力落地 4、负责搜索服务端的开发工作,优化索引构建、查询处理等核心环节 5、与算法团队紧密协作,将搜索算法能力高效集成到工程系统中,实现搜索效果持续优化 6、构建搜索效果评估体系,设计A/B测试框架,通过数据驱动方式持续提升搜索质量 7、保障搜索系统的稳定性与性能,解决高并发、大规模数据处理等工程挑战,支撑复杂业务场景
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
AI Business成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于AI技术能力建设和AI产品能力输出,旨在用最先进的AI技术重塑平台竞争力,为商家和用户带来极致的电商体验。 作为跨境电商领域的AI先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对AI领域人才的培养和发展。我们已经汇聚了业内顶尖的AI算法专家、AI工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的AI人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 1、AI 计算框架的设计与实现,包括并行计算、访存优化、量化、任务切分调度,pipeline等,支持LLM大语言模型、生成式CV模型、多模态模型等的高效计算 2、实现大规模高性能计算集群的合池管理,包括任务的统一分发调度,资源动态调度使用,离在线一体等,达成计算资源的高效利用 3、通过AI infra的研发,保障客户体验,实现业务落地和低成本