阿里巴巴业务技术-Agent数据算法工程师-供给智能
任职要求
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 2、具有大模型预训练数据构建Pipeline搭建经验者优先,具备路径级(CoA)数据采集与质量评估经验者优先; 3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deep…
工作职责
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2、重点探索模型后训练数据质量评估和清洗Pipeline的体系化构建,构建高质量路径级(CoA)训练数据的自动化校验和清洗方案; 3、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答等方面的能力; 4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点关注模型评测Benchmark、数据构建、Agent自动化评测等技术和应用方向; 5、结合AI基建产品构建起人机协同的Agent训练数据质量和规模的持续提升优化技术能力,为各垂类Agent构建起高质量的训练数据池。
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、构建Agent RL所需的环境、训练方法,设计合理的Reward Function和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的Agent优化方案; 4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI搜索、图像连续编辑、GUI Agent等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答等方面的能力; 3、构建Agent RL所需的环境、训练方法,设计合理的Reward Function和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的Agent优化方案; 4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI搜索等方向的应用创新; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率。
1、搭建面向行业运营场景的AI应用,负责agent设计、业务模型抽象、工程开发等工作,促进运营方式更加智能化。 2、负责统一的智能运营平台建设,探索AI-Native的研发模式和应用形态,提升AI运营应用的研发效果和效率。 3、熟悉行业运营业务,通过技术驱动运营方式的变革,打造有影响力的AI应用产品。
1、参与或负责剪映CapCut、即梦、醒图等产品的后端核心链路工作,后续重点是向AI后端架构演进; 2、视频工具:参与剪映CapCut视频编辑器及AI能力的研发工作,包括但不限于智能成片,多轨道编辑器,数字人,音乐生成,生图生视频等核心AI能力; 3、内容生态:参与剪映CapCut模板内容生态的研发工作,包括模板作者增长、作者激励、模板分发等核心链路; 4、AI基建:参与AI网关能力建设,包括排队、审核、流量调度、限流等基础能力,同时参与AI算法工程优化、推理加速等; 5、商业化:参与会员营收链路的建设工作,包括权益供给、订单交易、权益消费、营收增长等核心链路,同时精细化各种商业化相关策略,保障业务营收&用户体验的双赢; 6、即梦:参与即梦生图、生视频、数字人核心链路、即梦内容社区、故事Agent、创作Agent等工程研发工作,保障核心链路稳定性、做好架构升级演进、优化成本和性能。