千问千问事业部-大模型后训练算法专家-AI教育

社招全职2年以上技术类-算法2026-06-26地点：北京状态：招聘

扫码手机上打开

任职要求

1、精通python/c++/shell等常用语言，有扎实的数据结构和算法基础，熟练掌握tensorflow/pytorch训练平台；
2、熟练掌握Post-train相关技术，…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责面向AI教育领域战略级内容产品建设和应用，结合大模型前沿技术解决行业核心问题。
2. 负责提升面向核心任务的大模型后训练和综合效果迭代。通过大模型、NLP、强化学习等级技术完善智能决策、内容理解等核心领域的应用技术体系。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

C+++

Bash+

数据结构+

还有更多 •••

登录查看完整学习资料

相关职位

AI搜索算法专家(大模型后训练方向)

社招5年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发，包括SFT、偏好学习、强化学习等算法研发、优化与创新，提升AI搜索的回复效果； 2.跟踪AI搜索领域的前沿技术，参与前沿算法研究，推动研究成果在业务场景的落地应用； 3.参与产品讨论，基于技术对产品提出改进建议。

更新于 2025-11-29北京

大模型后训练算法专家（coding方向）

社招1-3年J0011

1、代码数据的大规模自动化收集，合成和评测，并研究数据构成对代码大模型效果的影响； 2、跟踪agentic coding前沿算法，并能够根据场景改进相关算法，提升模型代码性能； 3、跟踪强化学习前沿算法，并能够根据场景设计突破性的奖励函数和学习机制。

更新于 2026-07-03北京

微信-基座大模型后训练算法专家

社招3年以上WXG公共技术

1.基座大模型（LLM）推理能力和通用能力的核心技术研发，包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化，突破模型智力上限； 2.提升基座大模型在复杂场景的高阶处理能力，如多轮交互（复杂指令遵循、多轮对话、角色扮演等）、Agent 能力（融合“思考模式”与“非思考模式”，实现自主、精准的函数与工具调用）； 3.跟踪前沿技术，参与前沿算法研究，如研发更高效的强化学习（RL）训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等，推动研究成果在业务场景的落地应用； 4.对于探索前沿技术有很好的热情，具备独立探索前沿技术的能力，有良好的团队协作和沟通能力。

更新于 2026-06-16北京

多模态大模型后训练算法专家-【Keye】

社招J0011

1、主导多模态大模型（Keye）基座模型的后训练全流程优化，包括指令微调（SFT）、强化学习（RLHF/DPO/PPO）、模型蒸馏等技术的研发与工程实现，持续提升模型在通用领域及垂直领域（如短视频理解、电商理解）的泛化能力和安全性； 2、参与多模态合成数据生成（覆盖纯文本、图文及视频等内容理解维度）、建立数据质量评估体系，设计数据蒸馏流程，推动数据-模型-评测迭代优化； 3、面向短视频社区、电商内容理解等场景，解决后训练阶段的核心挑战，如跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等；推动技术成果转化，主导模型在快手短视频社区的集成落地（例如RAG增强系统、多模态Agent任务规划），并通过API封装与服务化支撑业务创新； 4、跟踪前沿多模态大模型后训练技术的前沿演进，探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向，形成专利或顶会论文提升团队技术影响力。

更新于 2026-06-23北京