夸克算法工程师 - 大模型 Post Training

校招全职智能信息秋季2026届应届生招聘2025-08-13地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

我们希望你
1. 具备出色的编程与工程实现能力，精通至少一门主流开发语言（如 C/C++、Java、Python 等）；
2. 在自然语言处理、计算机视觉、多模态建模或通用人工智能等方向具有良好学术基础与实践能力，熟悉深度学习主流框架（如 PyTorch、TensorFlow）；
3. 对大模型训练、多模态理解、Post-training 方法等有一…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

夸克大模型团队致力于自主构建面向未来通用人工智能（AGI）的大模型技术能力。依托领先的工程基础与业务生态，已实现千亿参数规模模型的高效训练与部署，在通用搜索、医疗健康、教育学习、智能创作、职场办公等核心领域形成深度应用。  
我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入，围绕大模型的前沿技术展开系统性探索与工程落地，在这里您将深度参与： 
1. 参与研发基座 LLM、多模态大模型等下一代人工智能 Post-trianing 技术，探索 SFT 数据构建、高效稳定训练方法、多源模型融合、longCoT 训练等前沿技术方法，打造业界一流的大模型效果；
2. 参与构建多模态任务（如图文问答、视频对话）的协同训练策略，提升模型跨模态一致性；
3. 和算法、工程、评估团队协作，参与构建统一的数据处理、训练与评测方法；
4. 负责跟踪和研究大模型前沿技术，探索大模型技术在 AI 搜索、Agent 等公司业务场景中的大规模应用；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+

C+++

Java+

Python+

NLP+

OpenCV+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

混元大模型应用算法工程师-混元大模型应用算法工程师

社招2年以上混元-模型算法技

1.负责混元大模型 Post-training 研发与应用，根据落地场景优化混元模型能力和 AI PaaS效果，包括 Agent 构建与强化、多轮对话、翻译等； 2.负责混元在公司内相关业务场景落地，根据业务需求优化混元模型，提升业务效果； 3.跟踪和探索大模型的前沿问题，结合实际场景，提供全面的技术解决方案，参与前沿算法与应用的研究。

更新于 2026-03-25北京

通义实验室-大模型Post-training算法工程师-通义千问

社招1年以上技术类-算法

在蕴含丰富世界知识的预训练模型的基础上，我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术，探索大模型潜能的同时，也在塑造大模型的能力与性格。本着为人类服务的目标，我们的 Post-train 将会重点探索其推理能力，实现深度思考，并致力于提升其 Agent 能力，让大模型服务于真实世界的任务。工作职责： 1. 探索更多可 scalable 的 verifier 信号，并通过 RL 提升模型的各项能力。 2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力，减少reward hacking和bias。 3. 研究 reasoning path压缩和外推，实现更高质量的推理思考。 4. 将LLM的推理能力和Agent以及其他模态相结合，探索统一模态的reasoning。

更新于 2025-06-05北京|杭州|上海

通义实验室-大模型Post-training算法工程师-通义千问

社招1年以上技术类-算法

更新于 2025-11-25北京|杭州|上海

通义实验室-大模型Post-training算法工程师-Qwen

社招1年以上技术类-算法

通义千问（Qwen）是由通义实验室自主研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。在蕴含丰富世界知识的预训练模型的基础上，我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术，探索大模型潜能的同时，也在塑造大模型的能力与性格。本着为人类服务的目标，我们的 Post-train 将会重点探索其推理能力，实现深度思考，并致力于提升其 Agent 能力，让大模型服务于真实世界的任务。工作职责： 1. 探索更多可 scalable 的 verifier 信号，并通过 RL 提升模型的各项能力。 2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力，减少reward hacking和bias。 3. 研究 reasoning path压缩和外推，实现更高质量的推理思考。 4. 将LLM的推理能力和Agent以及其他模态相结合，探索统一模态的reasoning。

更新于 2026-04-02北京|杭州|上海