快手AI Agent研发工程师(上下文工程方向)
任职要求
1、本科及以上学历,计算机、人工智能相关专业优先; 2、熟悉至少一种编程语言(如 Python、Golang、Java 等),掌握常用数据结构与算法,具备良好的编程基础; 3、对 RAG 技术有深入理解,熟悉主流 Embedding 模型、向量数据库(如 Milvus、Pinecone、Weaviate 等)及检索方案;…
工作职责
1、负责 RAG(检索增强生成)核心能力的研发与优化,包括检索策略、召回排序、知识融合等关键环节,持续提升生成质量和准确性; 2、设计和实现 Agent 长记忆机制,支持跨会话的信息持久化、记忆检索与更新,提升 Agent 的长期交互体验; 3、深入研究上下文工程底层技术,探索向量检索、混合检索、语义分块、查询改写等方向的效果优化; 4、关注 Agent 系统的整体技术演进,理解工具调用、规划执行、多智能体协作等核心机制,从上下文工程视角为 Agent 能力提升提供支撑; 5、跟踪上下文工程及 Agent 领域最新研究进展,快速验证和落地前沿技术方案; 6、建立效果评估体系,通过实验和数据驱动的方式持续迭代优化 RAG 和记忆系统的表现。
业务场景: 在开放世界游戏环境中,进行游戏内容理解与动态解说,驱动智能体完成指定任务、实现自主探索,并支持多智能体复杂交互等前沿AI应用场景。 岗位职责: 研究与开发: 负责开放世界游戏场景下基于大语言模型(LLM)及视觉语言模型(VLM)的智能体(Agent)技术研究与开发,涵盖Prompt工程、上下文学习(ICL)、检索增强生成(RAG)、监督微调(SFT)、强化微调(RFT)等关键技术。 框架与工具链构建: 主导游戏智能体核心框架的设计与实现,推动训练数据合成、自动化评测体系及相关算法的研发。 工业化落地: 推动游戏智能体技术在游戏内容生产与玩家消费场景的工业化部署与产品化落地,实现技术价值转化。
1.负责基于大模型的文本内容理解和生成任务在业务上的落地工作:; 2.参与微信读书、微信输入法的 AI 应用的持续探索和落地; 3.参与长上下文任务的推理优化、索引构建、复杂语义理解以及内容理解的工程落地和优化,负责 AI 应用系统及其数据工程链路的构建和维护; 4.基于大模型,优化现有的开发和数据链路,提升研发效率; 5.参与新技术调研以及探索,包括大模型相关的工程算法的探索和逻辑,并且参与项目特定方向的重点、难点开发工作。
1.主导公司级的AI Tools平台架构设计,构建工具注册、语义加工与权限管理体系,设计多业务场景里Agent对工具的高效调用和管理平台; 2.开发公司级Agent-Tools协同框架,设计Tools动态检索、执行隔离与上下文共享机制,解决多Agent协同作业时的工具准召提升,结合RAG优化、知识库融合等技能,提升Agent在高并发下的工具决策效率; 3.建设高可用工具服务中台,优化工具调用链路(压测/熔断/降级/流量调度),支撑十到百万级QPS的工具服务响应,保障复杂业务场景的并发可靠性; 4.推进跨团队技术协同,主导工具接入标准制定、开发者生态建设与业务方联动,通过统一协议实现Agent-工具-业务系统的高效对接,有高度的服务客户意识;
1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。