
智能互联千问C端事业群-图像生成&编辑算法专家-杭州
任职要求
1.1年以上计算机视觉的实践经验,有以下研究方向优先: -多模态生成和理解:如文本/图像/视频/3D生成和编辑,以及其他相关的多模态经验; -熟悉前言多模态大模型技术,包括但不限于LLaVA、QwenVL、InternVL等; -熟练掌握SFT和RL训练策略,熟悉ms-swift、LLaMA-Factory等代码框架; -熟…
工作职责
1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等; 2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案; 3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。
1、负责多模态生成模型建设的长期策略和效果优化,搭建图像/视频生成模型的效果评估体系,输出评测需求,驱动数据生产和模型训练,打造行业有竞争力、且有特色的模型,并供给实现更大的业务价值。 2、有强业务视角和高内容Sense,深入调研和了解对模型的实际需求,针对不同场景,提出并推动模型优化、效果提升等改进策略,将模型能力与业务发展深度融合。 3、跟踪最前沿的技术和产品形态,判断行业发展趋势,评估潜在价值和应用可行性。
1. 负责CV内容安全防控体系搭建,建立CV内容审核能力、大模型安全评测能力、大模型可控生成能力,保证业务安全及大模型应用安全,利用视觉大模型解决业务安全风控需求; 2. 视觉大模型:参与视觉大模型风控的数据、算法、策略等完整体系建设,负责CV分类all-in-one、图像特征检索、开集OCR、视觉理解等算法研发,在业务场景打造行业一流的视觉大模型安全风控体系; 3、岗位特色:应对全风险问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。
千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地
我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。 你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。 主要职责: 1.设计与维护高扩展性、多模态数据基础设施 支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集 主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化 在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。 4.构建可视化与分析工具,辅助数据理解与反馈闭环 实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同,提升模型性能与数据对齐度 基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。 6.与数据产品团队合作,推进数据标准化与平台化建设 参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。