百度Agent评估工程师实习生(J92426)
任职要求
-学历背景: 计算机科学、软件工程、人工智能或相关专业的在校本科生或研究生。 -技术能力:具备扎实的编程能力,熟练掌握 Python 语言。对大模型能力评估有基本认知。 -个人特质:对创新事务有足够的热情,学习能力强,主动性强,具备严谨的逻辑思维和数据分析能力。
工作职责
-开发自动化评测框架:参与开发和维护Agent的自动化评测框架,实现对大模型多维度能力的自动化量化评估; -数据处理与结果分析: 处理模型运行结果数据,进行细致的数据分析,洞察agent在不同任务、不同场景下的表现,并识别其优势与不足; -撰写评测报告:基于分析结果,撰写清晰、专业的agent能力评测报告,为研发团队提供有力的决策支持; -参与构建benchmark,参与发表顶会论文,增加团队开源影响力;
1. 参与企业办公场景智能体架构的探索,协助实现AI Agent系统的功能模块开发; 2. 在导师指导下学习RAG、知识图谱等技术,参与基础推理框架的搭建与测试; 3. 接触大模型基础调优技术,学习通过数据标注与效果评估提升系统性能; 4. 配合业务团队完成需求分析,参与具体业务场景的功能实现与效果验证; 5. 协助优化智能体交互体验,参与系统基础能力的评估测试; 6. 学习Agent领域前沿技术(如ReAct/COT等),参与技术调研与demo实现。
工作内容:语言大模型技术的研究和应用 负责大模型方向技术的研究和应用,构建汽车垂域智能系统,工作内容包括以下三个方向: a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力 b. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,赋能整车业务 技术方向包括但不限于: 1. 模型架构、预训练方法、高效微调、模型评估及迭代 2. 知识增强、工具增强、AI Agent、RAG 3. 安全、时效性等问题解决 4. 训练和推理加速、模型量化、端测落地 5. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等 6、制定相关规范并形成项目管理文档。
1. AI Agent研究与实现:跟踪AI Agent、智能体等前沿技术,快速复现学术论文中的算法实现,构建原型系统并验证效果; 2. 大模型应用开发:基于现有大语言模型(LLM)开发智能应用,包括但不限于MCP(Model Context Protocol)集成、工具调用、多模态交互等功能实现; 3. AI驱动数据分析:探索和实现AI大模型在大数据分析场景中的应用,包括自动化数据处理、智能报表生成、数据洞察挖掘等; 4. 技术调研与落地:持续关注AI Agent框架(如LangChain、AutoGPT、MetaGPT等)的最新进展,评估并集成到实际项目中; 5. 知识沉淀与分享:整理技术文档,定期进行技术分享,协助团队提升AI技术能力;
工作内容:语言大模型技术的研究和应用 负责大模型方向技术的研究和应用,构建大规模通用智能系统,工作内容包括以下三个方向: a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力; b. 负责根据业务场景,抽象技术问题,建立大模型智能体解决方案; c . 负责将解决方案落地应用在具体业务场景,打造卓越的用户体验。 技术方向包括但不限于: 1. 全量微调、高效微调、模型评估及迭代; 2. 知识增强、工具增强、AI Agent、拟人化; 3. 幻觉、安全、时效性等问题解决; 4. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等。