百度数据平台-Data Agent 研发工程师-2026AIDU(J93348)
任职要求
-计算机科学、人工智能、机器学习等相关专业本科及以上学历 -有AI相关开发经验和实践,有AI Agent或智能对话系统开发经验者优先 -熟悉RAG技术栈,有实际项目经验(如基于LangChain、LlamaIndex等框架开发) -深入理解大模型的应用与优…
工作职责
-负责AI Agent及相关智能应用的设计、开发和优化,打造高效、可靠的Agent系统 -深入探索大模型(如GPT、Claude等)的应用场景,优化Agent的决策、推理和交互能力 -主导RAG(检索增强生成)相关技术的研发,提升Agent的知识检索与生成质量 -研究并应用最新的AI技术(如多模态、强化学习等),提升Agent的智能化水平 -与产品、算法、工程团队紧密协作,推动AI Agent的落地和规模化应用 -关注行业前沿技术动态,确保团队技术方案保持领先
加入DataWorks团队,一起构建下一代AI Native的大数据开发平台,包括但不限于以下工作: 1. 参与设计、开发和实现Data Agent,包括记忆模块、规划模块和工具调用模块; 2. 参与设计与开发基于大模型的可扩展的智能SQL编程助手,支持多轮推理、任务分解与上下文记忆; 3. 负责语言服务器协议(LSP)的实现与优化,支持主流SQL语言的智能提示、跳转、重构等功能; 4. 深入理解大数据开发者行为模式,通过日志分析与交互反馈,持续迭代提示策略,降低误触率、提升采纳率; 5. 支持高 QPS 下的低延迟响应,并建立完善的监控、告警与性能追踪体系,快速识别性能瓶颈、内存泄漏、连接堆积等问题; 6. 持续跟踪Data Agent、大模型、代码补全等前沿技术发展,推动团队技术水平提升。
1.负责数据科学平台dataops+mlops+devops相关工具链(包括Notebook、数据标注、合成、特征、模型、推理、Agent应用等)的设计和开发工作; 2.负责优化系统架构,提升在线特征、推理等服务的性能和稳定性,提升研发质量和效率。
负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1. 定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2. 构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3. 超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。