腾讯数据库领域模型后训练专家
任职要求
1.本科及以上学历,计算机、人工智能、数据科学相关专业,5年以上机器学习/深度学习工作经验,有大模型后训练或领域模型相关经验; 2.深入理解Transformer架构和大语言模型原理,熟练掌握SFT、RLHF、DPO等后训练技术,熟悉PyTorch/TensorFlow框架,有实际模型训练调优和分布式训练经验; 3.熟悉数据库原理、SQL语法、执行计划分析等专业知识,有数据库内核…
工作职责
1.负责腾讯云数据库AI服务领域大模型的SFT(监督微调)、RLHF(强化学习)等后训练工作,提升模型在SQL生成、性能诊断、故障分析等数据库专业任务上的准确性和可靠性; 2.负责数据库领域训练数据体系建设与模型评测基准(Benchmark)构建,包括高质量数据集采集标注、评估指标设计、模型能力持续迭代优化,确保模型满足重点客户的专业需求; 3.参与数据库场景的Prompt工程优化、模型安全防护、领域知识注入等关键技术落地,跟踪领域模型适配、指令微调、MoE、LoRA等前沿技术并推动创新应用,不断提升产品技术竞争力。
随着企业开始构建Agent并逐步上线,围绕AI应用的数据使用越来越被重视,特别是基于数据进行效果持续提升成为决定Agent是否成功的关键,比如应用评估、模型后训练、上下文优化等。云原生的产品中有大量的Agent实时运行数据和业务数据,我们正在这些产品之上构建新的产品能力,来帮助客户更好的利用这些数据用于Agent的持续效果优化。包括结合AI的场景对数据进行持续的处理、存储,以及与阿里云的其他AI产品进行集成,在不同的场景中使用。我们需要资深的产品专家来定义这些新的场景,并以产品化的形式交付给我们的客户,助力客户AI应用成功。主要的职责包括: 1. 深刻理解客户业务和场景需求,追踪AI行业发展趋势及技术发展动态,规划产品演进路径及迭代。一方面负责存量产品的持续增长,包括消息队列、Kafka、日志服务、可观测等产品;同时不断发掘存量产品与AI的结合,包括AI提升产品能力,以及产品如何在AI的新场景中发挥作用。 2. 探索AI应用数据领域的新方向产品的孵化和前期市场探索,场景包括如何将应用数据用于Agent智能体的持续效果调优,包含AI应用相关数据的采集、存储、处理,以及后续在智能应用评估、模型后训练中的使用,帮助用户构建AI应用数据飞轮,持续提升Agent效果。 3. 制定产品策略以及市场策略,以业务成功为导向,协同研发、售前、运营、文档等多角色共同达成业务目标。
1. 负责百炼Agent应用层infra对接阿里云的建设,包括AgentScope运行时以及工具沙箱和阿里云云资源和云服务的对接、Agent部署、和算法适配。 2. 负责百炼Agent在阿里云和企业场景效果的调优。 3. 从阿里云数据源开始,为Agent服务的Data Connector体系的设计和建设。 4. 形成系统的Agent评测体系,沉淀为Reward Model. 5. 负责Agent RL/Tuning相关的算法和工程链路、数据反馈链路的构建。 6. 负责更加通用的Agent调优机制的设计,融入百炼Agent智能体创建流程。 7. 负责阿里云或者企业场景中相关平台算法feature的落地。
1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作,覆盖机器学习系统多个子方向领域的工作,包括:数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等,建设支持AI全链路的研发平台与AI垂类应用开发平台,实现算法研发效率、和资源利用率的最大化,灵活可扩展的支持不同领域的个性化应用开发需求,为蚂蚁大模型研发链路及应用研发探索新的研发模式; 2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性。