夸克千问C端事业群-大模型后训练算法专家-AI教育
任职要求
1、精通python/c++/shell等常用语言,有扎实的数据结构和算法基础,熟练掌握tensorflow/pytorch训练平台; 2、熟练掌握Post-train相关技术,…
工作职责
1. 负责面向AI教育领域战略级内容产品建设和应用,结合大模型前沿技术解决行业核心问题。 2. 负责提升面向核心任务的大模型后训练和综合效果迭代。通过大模型、NLP、强化学习等级技术完善智能决策、内容理解等核心领域的应用技术体系。
千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地
负责AI眼镜背后的整体云端算法解决方案,包括语音助手、拍照问答、全模态live交互等核心能力。持续推动大模型(LLM/VLM)在逻辑推理、问答、复杂上下文理解、指令遵循、Agent智能体及多模态交互等核心方向取得突破性进展,打造行业领先的智能体验。具体职责包括: 1、LLM/VLM后训练技术研发与落地: 探索并应用SFT、RLHF、DPO、RLVR等训练范式及模型蒸馏等对齐策略,持续提升模型在RAG、行业知识掌握、用户偏好理解、指令遵循能力及抑制幻觉等方面的表现。 2、多模态统一模型构建: 规划并实施文本、语音、视觉等多模态信息的统一建模方案,确保模型在文本问答、图文百科、视频实时对话等复杂场景下具备精准的理解能力和高效的输出能力。 3、眼镜场景算法闭环迭代: 构建基于线上日志的数据飞轮,体系化建设眼镜场景专属训练数据集,并推动模型持续迭代更新。聚焦业务痛点,解决实际问题,构建坚实的技术壁垒。
我们正在构建世界级医疗垂直大模型,致力于通过AGI技术革新健康咨询与辅助诊疗场景,让精准医疗普惠每个家庭。如果你渴望在万卡算力集群上实现算法突破,用技术改变14亿人的生命质量,这是你不可错过的技术圣战。加入我们,定义医疗大模型的未来。 1. 负责后训练(Post-training)相关研发工作,提升模型在推理、Planning、RAG、指令跟随、工具调用等方面的能力; 2. 优化和迭代大模型的对齐训练策略,包括 SFT、RLHF、Self-play RL、Agent 优化等; 3. 对齐人类偏好、安全性,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题 4. 参与数据飞轮、数据合成、基准集合建设、评测工具的开发与发布等。
我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。 你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。 主要职责: 1.设计与维护高扩展性、多模态数据基础设施 支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集 主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化 在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。 4.构建可视化与分析工具,辅助数据理解与反馈闭环 实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同,提升模型性能与数据对齐度 基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。 6.与数据产品团队合作,推进数据标准化与平台化建设 参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。