
智能互联千问事业部-大模型应用算法专家-北京
任职要求
1.本科及以上学历,计算机/软件/数学等相关专业,1 年以上算法相关工作经验; 2.深入理解 RLHF 机制,具备 DPO、PPO 等至少一种主流对齐算法的大规模调优与落地经验;有复杂 Reward Model 训练经验者优先; 3.熟悉推理加速与部署,了解大模型推理底层的显…
工作职责
1.模型微调与训练:负责针对特定业务场景下的 Agent 需求,构建高质量指令微调数据集,对主流大模型(如Qwen 等)进行 SFT / DPO 微调,提升模型在推理、规划和工具调用上的表现; 2.Prompt工程与评测:设计并持续优化系统级 Prompt,构建针对 Agent 应用的自动化评测集(Evaluation)与评估指标,确保系统输出的准确性、稳定性和鲁棒性。 3.前沿技术追踪:持续关注 LLM、多模态、Agent 等方向的学术界最新论文及开源社区动态(如 HuggingFace, Github),并快速进行技术原型(PoC)的验证与落地。
1.模型微调与训练:负责针对特定业务场景下的 Agent 需求,构建高质量指令微调数据集,对主流大模型(如Qwen 等)进行 SFT / DPO 微调,提升模型在推理、规划和工具调用上的表现; 2.Prompt工程与评测:设计并持续优化系统级 Prompt,构建针对 Agent 应用的自动化评测集(Evaluation)与评估指标,确保系统输出的准确性、稳定性和鲁棒性。 3.前沿技术追踪:持续关注 LLM、多模态、Agent 等方向的学术界最新论文及开源社区动态(如 HuggingFace, Github),并快速进行技术原型(PoC)的验证与落地。
1.负责大模型应用算法相关的产品研发工作; 2.负责大模型应用场景及算法选型,进行算法模型训练与调优,优化产品性能,解决实际问题; 3.负责分析和挖掘用户使用数据,设计个性化推荐策略; 4.参与产品需求分析,设计、开发与评审。

1.负责大模型应用算法相关的产品研发工作; 2.负责大模型应用场景及算法选型,进行算法模型训练与调优,优化产品性能,解决实际问题; 3.负责分析和挖掘用户使用数据,设计个性化推荐策略; 4.参与产品需求分析,设计、开发与评审。
岗位描述: 全面负责千问大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。