阿里巴巴AI Agent算法工程师(大模型方向)
任职要求
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 2、对大模型前沿技术充满热情,具备攻克复杂技术难题的能力,能够快速实现Paper→Code→Solution的技术转化; 3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChain、AutoGen等Agent开发框架,有完整智能体系统搭建经验者优先。 (注:实习申请者需保证3个月或以上的实习周期,提供充足的GPU算力资源及丰富的业务场景实践机会)
工作职责
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破复杂推理、数据洞察、AI搜索、文案创作、图像连续编辑等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
团队介绍: 我们是高德渲染平台研发团队,专注于大模型等前沿技术在地图渲染领域的创新应用。我们的目标是打造智能化的渲染平台,提升渲染效果和质量,为用户带来更优质的体验。如果你对AI赋能渲染、智能化产品升级充满热情,欢迎加入我们! 具体职责包括但不限于: 1、结合大模型、机器学习技术,优化高德渲染平台,提升渲染效果和质量 2、针对特定业务场景,优化大模型,对大模型进行微调,实现专属技能模型的能力升级。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。
随着LLM、多模态、Agent应用技术的发展,优化和完善AI短视频、AI直播等AIGC应用的表现。主要工作包括: 1、模型微调: 使用微调技术对大模型进行业务适配和效果优化; 2、Agent化: 优化大模型调用Agent的工程链路,最终实现对优秀人类行为的端到端学习和拟人化对标; 3、数据驱动优化: 基于业务数据统计和挖掘,发现当前系统问题和待提升方面,进而制定优化计划; 4、行业对标: 紧跟基模和行业产品发展趋势,推动新技术的产品化落地。