百度数据平台-Data Agent 研发工程师-2026AIDU(J93348)
任职要求
-计算机科学、人工智能、机器学习等相关专业本科及以上学历 -有AI相关开发经验和实践,有AI Agent或智能对话系统开发经验者优先 -熟悉RAG技术栈,有实际项目经验(如基于LangChain、LlamaIndex等框架开发) -深入理解大模型的应用与优化,能结合业务场景设计高效Prompt或微调方案 -熟悉Agent工作流(如AutoGPT、ReAct等),具备多Agent协同开发经验更佳 -加分项:在GitHub、arXiv等平台有相关技术分享或开源项目;熟悉多模态Agent开发(如视觉-语言模型应用)
工作职责
-负责AI Agent及相关智能应用的设计、开发和优化,打造高效、可靠的Agent系统 -深入探索大模型(如GPT、Claude等)的应用场景,优化Agent的决策、推理和交互能力 -主导RAG(检索增强生成)相关技术的研发,提升Agent的知识检索与生成质量 -研究并应用最新的AI技术(如多模态、强化学习等),提升Agent的智能化水平 -与产品、算法、工程团队紧密协作,推动AI Agent的落地和规模化应用 -关注行业前沿技术动态,确保团队技术方案保持领先
加入DataWorks团队,一起构建下一代AI Native的大数据开发平台,包括但不限于以下工作: 1. 参与设计、开发和实现Data Agent,包括记忆模块、规划模块和工具调用模块; 2. 参与设计与开发基于大模型的可扩展的智能SQL编程助手,支持多轮推理、任务分解与上下文记忆; 3. 负责语言服务器协议(LSP)的实现与优化,支持主流SQL语言的智能提示、跳转、重构等功能; 4. 深入理解大数据开发者行为模式,通过日志分析与交互反馈,持续迭代提示策略,降低误触率、提升采纳率; 5. 支持高 QPS 下的低延迟响应,并建立完善的监控、告警与性能追踪体系,快速识别性能瓶颈、内存泄漏、连接堆积等问题; 6. 持续跟踪Data Agent、大模型、代码补全等前沿技术发展,推动团队技术水平提升。
1.负责数据科学平台dataops+mlops+devops相关工具链(包括Notebook、数据标注、合成、特征、模型、推理、Agent应用等)的设计和开发工作; 2.负责优化系统架构,提升在线特征、推理等服务的性能和稳定性,提升研发质量和效率。
1、主导(参与)规划和设计快手新一代 Data + AI 生产管治平台的后端技术体系以及软件架构,包括 离线/实时开发平台、数据安全、数据地图、大模型数据同步/任务调度等系统; 2、充分利用模型微调、提示词工程、RAG等大模型技术构建智能开发 / 运维 / 治理等生产智能化能力; 3、充分利用微服务、容器化等技术构建高可用、高扩展和低耦合高内聚的数据中台服务; 4、了解业界相关技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。
1.基于开源项目 Ray,打造业内领先的通用分布式计算引擎,包括但不限于以下方向:引擎内核(分布式Task调度与执行)、分布式数据处理框架、分布式在线服务编排框架等; 2.面向 Data + AI,支持和拓展以 Ray 为 infra 的多种业务场景,包括但不限于以下方向:数据科学、大模型训练数据管道服务、在线推理与离线推理、AI Agent与应用系统、隐私计算、图计算等; 3.与 K8S 深度融合,建设云原生环境下超大规模分布式系统的服务能力与平台化能力,为业务提供高可用、可扩展、高易用性的集群化服务; 4.参与开源共建与合作,提升团队与个人在业界的影响力。