阿里巴巴AI Agent算法工程师(大模型方向)
任职要求
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 2、对大模型前沿技术充满热情,具备攻克复杂技术难题的能力,能够快速实现Paper→Code→Solution的技术转化; 3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deeps…
工作职责
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破复杂推理、数据洞察、AI搜索、文案创作、图像连续编辑等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
1、参与通用大模型和领域大模型的post-train算法研发工作,包括SFT、RLHF、DPO、推理强化学习等; 2、参与大模型在AI搜索中的落地应用,包括function call、DSL、planning、图表理解、RAG等能力建设; 3、进行大模型在幻觉消除、multi-agent、self-play、表示学习、持续学习等前沿方向的研究。
1、 负责语言大模型(Large Language Model)的技术研究,包括但不限于Pretrain、SFT、RL等技术相关的算法研发、数据策略和合成、Infra策略优化等,以及相关的基础技术探索和创新等; 2、负责基础Pretrain模型、Instruct模型、推理模型等系列大模型的技术研发; 3、持续跟进并深入调研大模型前沿技术、开源方案,跟踪业内语言模型领域的最新进展并推进相关研究,打造业界影响力。
1、负责携程搜推多场景召回与排序模型优化,提升点击、时长、互动、转化等核心指标; 2、负责搜索生成式问答相关技术研发,探索LLM,Agent等创新NLP技术与搜推业务的结合 3、发现并解决搜索场景中在查询分析、意图识别、召回排序模型、相关性等方向的问题
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。