logo of quark

夸克千问C端事业群-VLM post training应用算法(千问chat)-北京/杭州

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、计算机科学、人工智能、数学、电子信息等相关专业硕士及以上学历;
2、有扎实的深度学习基础,基本工具(python/pytorch)熟练使用,熟悉业界前沿模型…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责千问app相机场景下的整体算法建设,核心是多模态问答能力。基于百亿图文视频数据以及亿级用户需求,持续推进模型效果和场景落地,尤其是多轮交互、多模对话、多模态planning、多模态reasoning等方向实现突破进展。
1、多模态planner的优化&探索,主要负责在复杂多轮/多模场景下的意图理解、路径规划、工具调用等能力建设,以及探索强化学习在复杂路径planning场景下的应用;
2、vlm后训练技术探索&落地,包括不限于SFT/RLVR/RLHF等训练范式、模型蒸馏等对齐策略,提升模型在多轮对话、行业知识、RAG、指令遵循、视觉推理、用户偏好等方面的能力;
3、建设完备的算法迭代体系,包括线上数日志据飞轮的搭建、训练数据流程化建设、模型迭代&合版机制的完善等,持续面向业务解决实际问题,构建技术壁垒;
包括英文材料
学历+
深度学习+
还有更多 •••
相关职位

logo of quark
社招1年以上技术类-算法

负责AI眼镜背后的整体云端算法解决方案,包括语音助手、拍照问答、全模态live交互等核心能力。持续推动大模型(LLM/VLM)在逻辑推理、问答、复杂上下文理解、指令遵循、Agent智能体及多模态交互等核心方向取得突破性进展,打造行业领先的智能体验。具体职责包括: 1、LLM/VLM后训练技术研发与落地: 探索并应用SFT、RLHF、DPO、RLVR等训练范式及模型蒸馏等对齐策略,持续提升模型在RAG、行业知识掌握、用户偏好理解、指令遵循能力及抑制幻觉等方面的表现。 2、多模态统一模型构建: 规划并实施文本、语音、视觉等多模态信息的统一建模方案,确保模型在文本问答、图文百科、视频实时对话等复杂场景下具备精准的理解能力和高效的输出能力。 3、眼镜场景算法闭环迭代: 构建基于线上日志的数据飞轮,体系化建设眼镜场景专属训练数据集,并推动模型持续迭代更新。聚焦业务痛点,解决实际问题,构建坚实的技术壁垒。

更新于 2026-01-20北京|杭州
logo of quark
社招3年以上技术类-算法

岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。

更新于 2026-01-20北京|杭州
logo of quark
社招2年以上技术类-算法

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得    1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。    2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。    3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-12-16北京|杭州
logo of quark
社招3年以上产品类-用户型

1. 产品规划与设计: 负责办公领域独立产品的整体规划与体验设计。结合公司业务战略、AI技术演进趋势与用户在办公场景中的真实需求,制定清晰的产品架构与落地方案,确保输出内容在专业性、准确性、一致性及合规性方面达到高标准。 2. 场景驱动的体验创新: 深入挖掘用户在写作、翻译、信息处理、会议等核心办公场景下的痛点。运用 LLM、VLM、ASR、TTS等技术,提出创新的产品解决方案,并持续迭代优化。 3. 全生命周期管理: 主导AI办公产品从POC、0到1再到N的全生命周期管理,制定清晰的产品发展路线图与上线节奏,确保核心功能高效、稳定地快速迭代与落地。 4. 跨团队协同推进: 与业务、技术、算法、UED、工程等团队紧密协作,高效推动跨部门资源整合与项目执行,确保产品目标与用户体验双达标。 5. 行业洞察与策略支持:持续跟踪国内外AI办公工具的产品动态,结合用户反馈与数据分析,为产品迭代和商业化策略提供前瞻性建议。

更新于 2026-01-12杭州|北京|广州