logo of aligenie

智能互联千问C端事业群-千问/夸克-Post-Training 高级算法专家-北京/杭州

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


● 计算机科学、人工智能、电子工程或相关领域的硕士或博士学位。
● 在顶级学术会议 (NeurIPS, ICML, ICLR, ACL, EMNLP 等) 发表过相关高质量论文。
● 在自然语言处理 (NLP) 或大模型 (LLM/VLM) 领域拥有 3 年以上的研发经验,对 Post-training 技术(SFT, RLHF, DPO, PPO、RLVR 等)方向拥有深厚的理论功底和业界公认的成功实践案例。
● 对深度学习和机器学习有精深的理解,尤其熟悉 Transformer、MoE…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位描述:
全面负责千问大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。

工作职责:
● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。
● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。
● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。
● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。
● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。
包括英文材料
学历+
NeurIPS+
ICML+
ACL+
EMNLP+
NLP+
大模型+
SFT+
还有更多 •••
相关职位

logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京
logo of kuaishou
社招D4870

1、负责快手国际化Push相关的算法研发、优化工作,运用策略和算法手段促进用户增长; 2、负责Push推荐系统的搭建以及相关算法落地,面对亿级别的用户群体情况下实现Push的个性化匹配,做到千人千面; 3、负责Push的算法、策略的设计,并直接参与Push场景下推荐系统的全链路开发与优化,包括但不局限于触发、召回、粗排、精排、下发策略等阶段; 4、从海量数据中挖掘用户消费行为、社交关系网以及运营热点实现Push内容池的搭建。

更新于 2025-04-09北京
logo of alibaba
社招2年以上

团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 工作职责 1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛 2. 进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验 3. 应用不限于剪枝、量化、知识蒸馏、分布式计算(数据并行、模型并行、混合并行)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能 4. 和工程团队协同,实施并维护自动化工具和流程,以简化和加速模型训练和推理的部署过程 5. 研究最新的机器学习和深度学习技术,跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并将其应用到淘宝搜索生产环境中 6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性

更新于 2026-02-04北京|杭州
logo of alibaba
社招3年以上

“我们正在引领搜索技术的下一代革命,致力于通过大模型重构电商搜索与推荐的核心链路”。团队聚焦生成式召回、多模态理解、语义大模型 等前沿方向,打造“千人千面”的极致个性化体验,并推动语义理解与个性化召回的深度融合。如果你渴望用大模型重新定义亿万用户的购物体验,这里将是你的理想战场! 1.主导大模型在搜索场景的落地与创新,设计生成式召回策略 、多模态语义理解模型 及个性化排序算法 ,提升搜索结果的相关性与多样性; 2.探索大模型在用户意图理解、商品知识挖掘中的应用,构建端到端的语义搜索系统,解决长尾查询与跨模态匹配的技术难题; 3.驱动多模态交互创新,实现文本、图像融合的智能搜索体验,并探索AI Agent在购物场景中的主动服务模式。

更新于 2025-04-16杭州