logo of tencent

腾讯数据库领域模型后训练专家

社招全职5年以上腾讯云-数据库技术地点:成都状态:招聘

任职要求


1.本科及以上学历,计算机、人工智能、数据科学相关专业,5年以上机器学习/深度学习工作经验,有大模型后训练或领域模型相关经验;
2.深入理解Transformer架构和大语言模型原理,熟练掌握SFT、RLHF、DPO等后训练技术,熟悉PyTorch/TensorFlow框架,有实际模型训练调优和分布式训练经验;
3.熟悉数据库原理、SQL语法、执行计划分析等专业知识,有数据库内核…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责腾讯云数据库AI服务领域大模型的SFT(监督微调)、RLHF(强化学习)等后训练工作,提升模型在SQL生成、性能诊断、故障分析等数据库专业任务上的准确性和可靠性;
2.负责数据库领域训练数据体系建设与模型评测基准(Benchmark)构建,包括高质量数据集采集标注、评估指标设计、模型能力持续迭代优化,确保模型满足重点客户的专业需求;
3.参与数据库场景的Prompt工程优化、模型安全防护、领域知识注入等关键技术落地,跟踪领域模型适配、指令微调、MoE、LoRA等前沿技术并推动创新应用,不断提升产品技术竞争力。
包括英文材料
学历+
数据科学+
机器学习+
深度学习+
大模型+
Transformer+
还有更多 •••
相关职位

logo of aliyun
社招8年以上云智能集团

随着企业开始构建Agent并逐步上线,围绕AI应用的数据使用越来越被重视,特别是基于数据进行效果持续提升成为决定Agent是否成功的关键,比如应用评估、模型后训练、上下文优化等。云原生的产品中有大量的Agent实时运行数据和业务数据,我们正在这些产品之上构建新的产品能力,来帮助客户更好的利用这些数据用于Agent的持续效果优化。包括结合AI的场景对数据进行持续的处理、存储,以及与阿里云的其他AI产品进行集成,在不同的场景中使用。我们需要资深的产品专家来定义这些新的场景,并以产品化的形式交付给我们的客户,助力客户AI应用成功。主要的职责包括: 1. 深刻理解客户业务和场景需求,追踪AI行业发展趋势及技术发展动态,规划产品演进路径及迭代。一方面负责存量产品的持续增长,包括消息队列、Kafka、日志服务、可观测等产品;同时不断发掘存量产品与AI的结合,包括AI提升产品能力,以及产品如何在AI的新场景中发挥作用。 2. 探索AI应用数据领域的新方向产品的孵化和前期市场探索,场景包括如何将应用数据用于Agent智能体的持续效果调优,包含AI应用相关数据的采集、存储、处理,以及后续在智能应用评估、模型后训练中的使用,帮助用户构建AI应用数据飞轮,持续提升Agent效果。 3. 制定产品策略以及市场策略,以业务成功为导向,协同研发、售前、运营、文档等多角色共同达成业务目标。

更新于 2026-01-09北京|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责百炼Agent应用层infra对接阿里云的建设,包括AgentScope运行时以及工具沙箱和阿里云云资源和云服务的对接、Agent部署、和算法适配。 2. 负责百炼Agent在阿里云和企业场景效果的调优。 3. 从阿里云数据源开始,为Agent服务的Data Connector体系的设计和建设。 4. 形成系统的Agent评测体系,沉淀为Reward Model. 5. 负责Agent RL/Tuning相关的算法和工程链路、数据反馈链路的构建。 6. 负责更加通用的Agent调优机制的设计,融入百炼Agent智能体创建流程。 7. 负责阿里云或者企业场景中相关平台算法feature的落地。

更新于 2025-11-12北京|杭州|上海
logo of antgroup
社招3年以上技术类-开发

1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作,覆盖机器学习系统多个子方向领域的工作,包括:数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等,建设支持AI全链路的研发平台与AI垂类应用开发平台,实现算法研发效率、和资源利用率的最大化,灵活可扩展的支持不同领域的个性化应用开发需求,为蚂蚁大模型研发链路及应用研发探索新的研发模式; 2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性。

更新于 2025-10-14北京|上海|杭州
logo of didi
社招技术

负责滴滴智能客服对话算法,具备系统、扎实的算法功底,结合业务场景,构建下一代客服 Agent,驱动服务体验与效率提升。 工作内容: 1、主导智能客服 Agent升级改造,与产品+工程团队合作,设计算法架构和技术路线; 2、负责领域大模型的后训练和研究,如数据合成、增量预训练、监督微调、偏好对齐、推理能力、工具调用、多模态等; 3、提升现有功能模块的效率与效果,如意图识别、多轮对话、角色模拟、智能辅助等; 4、关注行业前沿,推进技术与业务场景的完美结合,探索创新方法,持续提升团队影响力。

更新于 2026-02-24