夸克千问C端事业群-千问/夸克-大模型预训练与应用算法工程师-杭州/北京

社招全职2年以上技术类-算法2026-01-09地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1.计算机、数学或统计学相关专业硕士及以上学历，具有2年以上计算机NLP/CV/AUDIO相关工作经验
2.扎实的深度学习理论基础，精通主流深度学习框架（如 TensorFlow、PyTorch），拥有大规模模型训练经验优先。
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 操控万卡规模的 GPU 集群，对超大参数量级的预训练模型进行高效分布式训练与优化。
2.深度参与多模态（图像、语音、文本、视频）大模型的研发，探索多学科交叉领域的新奇玩法。
3.我们的技术将为夸克亿万用户提供高品质的AI智能服务，见证前沿技术实现真正的用户价值

加入我们，你将获得：
1.与顶级专家携手，以世界级算力资源和数据支持为背书，不断挑战技术极限。
2.极具竞争力的薪酬与福利，人性化、追求卓越技术的的工程师团队文化，助你在职业成长道路上全速前进。
3.在通往 AGI 的征途上，亲历关键技术的诞生与应用，留下属于你的时代印记。
如果你渴望驰骋在大模型与 AGI 的蓝海之中，那么这将是你的最佳舞台！快来加入我们，一同开创智能时代的新纪元。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

深度学习+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-夸克网盘-应用算法-北京/广州

社招3年以上技术类-算法

岗位目标：面向人工智能前沿技术领域，聚焦计算机视觉、自然语言处理、大模型等核心技术，研发高性能、低时延的智能系统，支持语音助手、多语言交互、智能内容生成、视觉理解等多种应用场景，推动AI技术的产品化落地与规模化应用。具体职责包括但不限于：核心算法研发与优化：针对具体任务场景（如语音识别、机器翻译、图像理解、文本生成等），开展深度学习模型的算法设计与创新，探索新型神经网络架构（如Transformer、MoE、扩散模型等），提升模型在复杂环境下的准确性、鲁棒性与泛化能力。负责端到端建模优化，结合上下文理解、对话状态追踪或多模态融合技术，增强系统在连续交互场景中的语义理解与响应能力。构建高质量训练数据体系，设计自动化语料清洗、标注与增强方案，覆盖多语言、多方言、噪声或小样本等挑战性场景，支撑模型持续迭代。大模型技术研发与应用：参与大规模预训练模型（LLM、VL模型等）的研发与微调，包括指令微调、对齐优化、提示工程及推理加速，提升模型在下游任务中的表现。探索大模型在跨模态理解（图文、音视频）、实时生成、知识推理等场景的应用路径，推动AIGC、智能摘要、自动字幕、翻译等业务的技术升级。研发高效微调技术（LoRA、Adapter等）与模型服务架构，实现大模型在资源受限环境下的灵活部署。系统性能优化与工程化落地：推动模型轻量化与推理加速，应用模型压缩、量化、蒸馏、剪枝等技术，提升模型在移动端、边缘设备或云端的运行效率。协同工程团队完成算法模块的高性能集成，优化分布式训练与推理框架，保障系统低时延、高并发与稳定性。支持多平台部署（移动端、PC端、Web端、云服务），参与全链路性能调优与监控体系建设。前沿技术探索与跨领域协作：跟踪人工智能领域最新研究进展（CV/NLP/ASR/TTS/MT等），结合业务需求进行技术预研与原型验证。与产品、数据、工程团队紧密协作，深入理解用户场景，推动AI能力在实际产品中的创新应用。

更新于 2026-02-05广州|北京

通义实验室-大模型数据处理与优化算法工程师-通义千问

社招3年以上技术类-算法

通义千问（Qwen）是由通义实验室自主研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。数据的规模和质量对模型效果起到至关重要的作用，团队重视数据的 scaling，包括但不限于自然语言、代码、多模态等数据的 scaling。团队正在寻找适应快速变化、热衷解决大规模数据挑战的算法工程师，专注于大模型预训练中的数据收集、处理与优化。面对百亿至千亿级别的数据规模，设计高效的数据处理管线，与纯文本和多模态预训练团队深度协作，持续提升数据质量和模型性能。工作职责： 1. 需求对接与迭代：快速理解模型预训练需求，灵活调整数据方案以适应高频迭代。 2. 数据处理与优化：开发工具完成数据收集、清洗、格式转换（如HTML2Text、PDF2Text、ASR等），构建验证与测试集以量化性能指标，优化流程以应对超大规模数据挑战。 3. 管线搭建与扩展：构建自动化、高效率的数据处理管线，优化组件性能，确保稳定性和可扩展性。 4. 协助数据平台建设：与平台团队合作共建数据平台，分析使用痛点，提出建议意见以改进易用性，并跟进落实。 5. 技术支持与创新：追踪业界技术进展，为预训练团队提供数据支持，探索新技术以提升数据价值和模型效果。

更新于 2026-01-20北京|杭州

飞猪-大模型高级算法工程师-agent算法

社招1年以上

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师，重点聚焦于旅行智能体（Agent）技术的研发与训练。我们已经开发了飞猪问一问，也接入了千问，如果你对创造能够自主感知、决策和行动的智能系统感到兴奋，并希望在大模型与强化学习结合的前沿领域大展身手，那么这个职位将非常适合你。你将加入我们的核心算法团队： 1、负责设计和实现下一代具有推理和行动能力的AI智能体，推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架，特别是Agentic Reinforcement Learning (Agentic RL) 相关算法，探索和实验多种智能体范式，如ReAct、CoT、ToT 等，并将其与强化学习相结合，开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调（SFT）和指令微调。

更新于 2026-01-26杭州

通义实验室-大模型预训练算法工程师-通义千问

社招1年以上技术类-算法

通义千问（Qwen）是由通义实验室自主研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。我们期望打造世界一流的预训练 LLM 基座，开发涵盖参数量从几百M到T级的基座模型，并将作为 Qwen / QwenVL / Qwen-Omni / Qwen-Coder 等系列模型的基座。我们追求将现有的预训练技术做到极致，并积极探索下一代的预训练技术。工作职责： 1. 预训练数据：大规模预训练数据合成技术探索、STEM & reasoning 优化、长尾知识优化、精品数据挖掘过滤、自然数据 scaling、长文本优化、面向 test-time scaling 的数据优化。 2. 预训练策略：新型预训练损失函数探索、遗忘对抗与持续学习、optimizer 优化、lr scheduler 优化、课程学习、scaling law 预测、超参优化。 3. 模型结构：新型模型结构探索、模型可解释性、MoE 优化、参数扩展与裁剪蒸馏、线性注意力、动态稀疏注意力、draft model 优化、动态计算优化、KV cache压缩、长序列优化、decoding 加速等。

更新于 2026-01-20北京|杭州|上海