飞猪旅行飞猪-算法高级工程师-多模态理解与生成
任职要求
1. 计算机、数学或统计学相关专业硕士及以上学历,具有2年以上多模态大模型研发、智能体研发、RAG或强化学习等相关经验; 2. 熟练使用pytorch/tensorflow等至少一种主流深度学习框架,能够独立实现前…
工作职责
1. 从事多模态大模型的训练,包括预训练、指令微调与对齐,强化学习/RLHF后训练,提升模型在复杂场景下的泛化与生成能力。 2.从事高效多模态数据管线。 3. 将多模态大模型应用于内容生产,拍照讲解,多模态对话等多个旅行行业场景落地。 4.跟踪并实践多模态生成大模型前沿技术,引入新的算法技术及理念,推动业务落地及技术优化。
1. 探索研究具身智能领域的多模态大模型、世界模型、生成式模型、AIGC等人工智能前沿技术; 2.探索大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、RLHF、模型优化;提升数据合成、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3. 探索突破包括而不限于多模态大模型、端到端VLA模型、视觉COT与Agent在内的多模态模型、世界模型; 4. 通过预训练或SFT,使用生成式模型技术能力对现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。
团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3.学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。
构建下一代基于大型语言模型(LLM)的智能搜索系统,通过深度语义理解与用户意图解析,实现从“关键词匹配”到“需求精准洞察”的跨越,推动搜索技术从信息检索向智能交互与决策赋能的范式升级! 1.负责设计并实现基于LLM的智能搜索架构,优化语义理解、意图识别与结果排序算法; 2.构建用户需求画像系统,结合实时行为数据动态调整搜索策略,提升搜索结果相关性与用户满意度; 3.探索生成式搜索技术(如Query扩展、结果摘要生成),推动搜索从“信息呈现”向“决策辅助”升级。
1. 行业垂直大模型训练与优化:负责针对特定行业进行垂直大模型的端到端训练与精调,深度挖掘行业数据价值,构建具备专业知识壁垒的AI核心能力。 2. 前沿技术探索与落地: 跟踪大语言模型、多模态及强化学习等前沿算法,并将其创造性地应用于钉钉的核心业务场景(如行业解决方案、商业化产品等),负责从技术到产品的全链路落地,持续推动AGI在真实世界中的价值实现。 3. AI原生应用构建: 依托钉钉强大的AI平台与自研的垂直大模型,主导构建AI原生应用。重点方向包括但不限于:高级认知搜索、可自主执行任务的智能体 (Agentic AI)、以及深度内容洞察与生成工具,打造具有核心用户价值和行业影响力的产品。 4. 智能化场景创新: 探索大语言模型、多模态及扩散模型等技术,在搜索、推荐、广告等场景的创新应用,设计并实现新一代智能化解决方案,提升用户体验与商业效率。