快手语言大模型算法专家-【Agent方向】
社招全职3-5年J0011地点:北京状态:招聘
任职要求
1、硕士及以上学历,计算机、人工智能等相关专业优先; 2、在大规模预训练、模型对齐、强化学习、RAG、Agent等至少一个方向有深厚的项目经验和洞察力;…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、基于快手自研基础大模型,构建Agent系统,并打造Deep Research等原生大模型应用; 2、参与包括但不限于agentic数据集构造、SFT冷启动训练、RL端到端训练agentic reasoning model、prompt优化等方向。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
还有更多 •••
相关职位
社招3年以上
1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力 2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料; 4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
更新于 2025-10-29杭州
社招10年以上
1、负责大语言模型(LLM)技术能力建设,持续提升丰语垂域大语言模型在下游应用的渗透; 2、负责大语言模型方向重点项目的技术路线制定、技术方案设计与评审、业务应用落地; 3、负责集团主要业务环节的智能体构建,推动推理智能和群体智能在各业务环节的深度融合和应用; 4、指导并培养算法工程师团队,提升算法团队在搜索、问答、推荐、数据分析、Agent方向的技术水平;
更新于 2026-01-16深圳
社招10年以上
1、负责大语言模型(LLM)技术能力建设,持续提升丰语垂域大语言模型在下游应用的渗透; 2、负责大语言模型方向重点项目的技术路线制定、技术方案设计与评审、业务应用落地; 3、负责集团主要业务环节的智能体构建,推动推理智能和群体智能在各业务环节的深度融合和应用; 4、指导并培养算法工程师团队,提升算法团队在搜索、问答、推荐、数据分析、Agent方向的技术水平;
更新于 2026-01-28深圳