腾讯腾讯云CodeBuddy—利用强化学习方法基于经验数据训练提升大模型Agent能力研究
1.负责腾讯云CodeBuddy等开发者产品的运营和用户增长,制定运营目标与规划,并推动执行与落地; 2.深度理解产品功能及特点,制定并执行产品运营方案,通过各种手段提升产品使用率和用户满意度; 3.制定并实施产品增长运营策略,通过数据分析和用户研究,不断验证并优化增长实践,满足客户需求; 4.明确产品存在的问题及优化建议,与研发团队紧密合作,推进产品迭代优化,并协助产品经理完成产品的规划设计。
1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题; 2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标; 3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent; 4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案。
1.负责腾讯云代码助手在垂直子领域的全链路研发工作,涵盖需求分析、架构设计、前后端开发及模型集成; 2.主导技术方案规划与评审,精心输出高质量设计文档,全力协调前后端及算法团队达成技术方案落地实施; 3.积极推动研发流程标准化,合理制定迭代计划并精准把控交付节奏,保证功能按时且高质量交付; 4.构建代码质量监控体系,主导性能优化与体验提升工作,有效提高产品内建质量与生成效果; 5.深度参与 AI 模型工程化落地,巧妙设计模型服务接口与数据交互方案,大力优化推理效率与资源消耗。