logo of quark

夸克智能信息-大模型训练数据专家-图像

社招全职1年以上运营-产品运营地点:北京 | 杭州 | 上海状态:招聘

任职要求


1、本科及以上学历,艺术、设计类相关专业优先;
2、熟悉大模型模型评估,有数据标注与管理的经验,具备从训练数据到模型效果评估到优化的完整经验者优先;
3、有较强的分析和沟通能力,擅…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、深度参与大模型前沿方向的数据工作,重点负责文生图模型的数据寻源、数据标注与管理,模型效果评估;
2、设计各技术方案下阶段的数据方案与策略,建设文生图大模型的数据生产和质量提升流程,管理高效高质的数据生产pipeline,建设起行业领先的数据生产标准;
3、建立科学的模型效果评估方案与策略,给出模型优化建议,助力模型效果达到业内一流;
4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
包括英文材料
学历+
大模型+
相关职位

logo of eleme
社招2年以上技术类-算法

1. 多模态大模型训练与优化。围绕文本、图像等多模态数据,构建面向安全领域的垂直大模型,推动在内容理解、风险识别等场景的落地应用。 2. 模型架构设计与迭代。基于现有大模型底座,进行模型结构优化、训练策略设计及效果调优,提升模型在实际业务中的泛化能力与推理效率。 3. 数据处理与标注体系建设。构建高质量的多模态训练数据集,设计合理的标注流程与标准,支撑模型训练与评估。 4. 联合业务方推进模型部署与应用。与产品、工程团队紧密协作,完成模型从训练到上线的全流程闭环,并持续跟踪效果与优化。

更新于 2025-09-30杭州
logo of meituan
校招核心本地商业-基

数据与训练方向: 1.大模型数据体系建设:构建多语言和多模态的数据处理流程和实验链路,优化数据的筛选与配比策略,探索动态数据调整、多阶段训练和课程学习等方法提升数据质量和多样性,优化大模型的训练效果。 2.合成数据探索:探索大规模合成数据方法,应用于复杂任务、推理、代码和多模态等场景。制定合成数据在预训练、强化学习等不同训练阶段的应用策略,并深入研究数据扩展规模定律、数据多样性和模型坍塌等基础问题,推动数据驱动的性能突破。 3.多模态学习与推理:探索多模态预训练的新范式,突破模态融合瓶颈。具体包括实现多模态能力的早期融合、理解与生成的统一建模,研究多模态扩展定律以指导数据与训练方案,扩展超长上下文机制以支持全模态场景等。同时,面向复杂的多模态推理与交互场景,探索多模态强化学习、多模态奖励模型、推理阶段扩展(test-time scaling)以及全模态链式思维(CoT)等方法,提升模型处理复杂任务和全模态交互的能力。 4.高效模型架构设计:设计高效的大模型架构以提升训练和推理效率。探索 MoE(混合专家)、稀疏注意力、线性注意力等高效模型结构,以及模型编辑与合并等技术,研发能够显著提升推理速度和资源利用率的新型模型架构。 5.推理效率与性能优化:推动算法与系统的协同优化,实现模型性能与效率的最大化平衡。基于对硬件计算潜力的深度挖掘,开发高效的模型推理方案和算法,包括模型压缩、剪枝、量化、稀疏化等,降低模型应用部署成本。 后训练方向: 1.后训练数据与流程建设,从指令数据生产、合成、进化、配比等方面提升数据质量,优化指令微调、强化学习、奖励模型等训练pipeline,提升模型综合能力; 2.后训练关键能力建设,包括但不限于优化模型创意生成、多语言、逻辑推理、复杂指令遵循、代码生成、工具调用等能力,提升模型可控性和安全性,拓展模型能力边界; 3.面向准确性、多模信息、最优路径等方向,探索奖励模型的新范式,构建统一模型学习环境,实现模型的价值对齐和能力对齐; 4.面向推理规划能力、多智能体系统、模型自进化等方向,探索下一代强化学习算法,持续提升大模型的智能水平和在真实复杂场景效果; 5.前沿探索:动态推理计算优化(Test-time Compute Optimization)、多智能体协同进化架构 、大规模强化学习系统优化等。

更新于 2025-05-23北京|上海
logo of quark
校招智能信息秋季20

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得 1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。 2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。 3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-08-13北京|杭州
logo of liauto
社招智能与信息技术

1. 负责音频、语音等算法的处理和实现; 2. 负责智能座舱内语音分离与增强、语音唤醒、语音识别算法的研发和落地; 3. 负责多模态融合算法、多模态大语言模型的研发与落地。

北京