夸克千问C端事业群-大模型推理优化专家-模型压缩&加速

社招全职3年以上2026-04-02地点：北京 | 杭州 | 广州状态：招聘

扫码手机上打开

任职要求

1、精通大语言模型的基础架构（如Transformer等）和推理流程；
2、在量化/稀疏/剪枝/投机采样等任一…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、研究并应用先进的模型压缩技术，在极小精度损失下实现模型瘦身与加速；
2、研发并落地大模型低比特（INT8/INT4/FP8/FP4等）量化技术，开发与硬件协同的量化部署方案，攻克干亿参数模型低比特推理精度挑战；
3、研发并优化新一代投机采样技术，探索多模态与MoE架构加速，构建动态投机采样策略，联合工程团队打造高效训练推理引擎，最大化吞吐收益；
4、研发并应用结构化/非结构化稀疏与剪枝技术，探索与改进KV-Cache压缩、Token剪枝、Prompt压缩及CoT压缩等动态稀疏化方法，以显著降低内存占用并提升系统吞吐。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+

C+++

Python+

大模型+

vLLM+

SGLang+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-大模型推理优化专家-北京/杭州

社招3年以上

1、主导大模型在线推理系统的性能攻坚，构建多节点多GPU的分布式推理架构，实现智能请求调度算法与异构硬件的极致性能调优； 2、研究低bit量化、稀疏化attention等解码加速技术，在保障精度前提下显著降低计算资源消耗； 3、设计高并发场景下的负载均衡方案，构建支持动态扩展的弹性计算架构，优化推理引擎运行时环境，实现毫秒级延迟与高QPS吞吐能力。

更新于 2025-12-11北京|杭州

千问C端事业群-千问/夸克-VLM训练与对齐算法专家-北京/杭州

社招2年以上技术类-算法

1. 跨模态长程预训练：设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略，操控万卡级 GPU 集群，协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路，对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚：深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级：与系统团队共建张量并行、流水并行、混合精度等高性能训练框架，持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造：快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目，输出专利与论文，树立行业技术标杆 5. 高速驱动夸克AI相关业务：赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品，实现多模态能力的快速迭代与落地。加入我们，你将获得 1. 顶尖资源：与行业专家并肩作战，万卡算力与海量数据随手可用，持续挑战技术天花板。 2. 高速成长：极具竞争力的薪酬福利与纯粹的工程师文化，为你的职业加速。 3. 时代机遇：亲历 AGI 关键技术的诞生与规模化应用，在智能时代留下你的名字。如果你渴望驰骋于大模型与 AGI 的蓝海，这里就是你的最佳舞台。立即加入我们，共创智能新时代！

更新于 2025-12-16北京|杭州

千问C端事业群-千问/夸克-VLM训练与应用数据工程师-杭州/北京

社招2年以上技术类-算法

我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集，服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化，并深度参与高价值数据（如推理类任务数据、领域权威知识数据）的构建与增强，为模型的理解力、泛化能力与推理能力提供坚实数据支撑。你将与算法工程师、数据产品经理紧密合作，共同推动数据与模型的正反馈闭环，包括数据构建策略共创、实验验证、产品化数据标准制定等，在万卡集群的充足算力支持下，实现“数据即能力”的宏大目标。主要职责： 1.设计与维护高扩展性、多模态数据基础设施 支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理，满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集 主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集，服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化 在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能，提升数据准备效率与稳定性。 4.构建可视化与分析工具，辅助数据理解与反馈闭环 实现多模态数据分布可视化、异常聚类检测与质量诊断，服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同，提升模型性能与数据对齐度 基于模型效果与损失分析，共同制定数据增强策略、采样分布设计、多轮训练数据构造方法，实现数据与模型迭代的高效协同。 6.与数据产品团队合作，推进数据标准化与平台化建设 参与数据标签体系、任务定义、多模态对齐协议等的标准制定，推动数据处理工具、标注平台、数据质量评估体系的产品化落地。

更新于 2025-12-09北京|杭州

千问C端事业群-多模态大模型Posttrain工程师-北京

社招3年以上技术类-算法

千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题，并收获服务千万级用户的成就感和影响力。 1. 负责面向场景的多模态大模型研发，包括图文、视频、音频等多个模态的预训练，探索多模态的数据质量评估和清洗方法； 2. 负责对模型的训练数据、训练策略、模型结构等进行深入分析，指导评测方式迭代以及模型训练策略优化； 3. 负责视觉深度推理、数字化理解、实时语音交互对话、视频生成等能力建设； 4. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化； 5. 负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线，提升业务效果；

更新于 2026-02-03北京