快手(大模型专项)生成式AI引擎工程师
任职要求
1、研究生及以上学历,计算机科学与技术、软件工程或图形图像相关专业; 2、熟悉C/C++开发,熟悉Python,熟练掌握常用数据结构及算法,对计算机体系结构、操作系统及计算机网络有深入理解; 3、熟练掌握服务性能分析与优化技能和工具; 4、有深度学习框架(PyTorch/TensorFlow/Caffe等)优化经验; 5、具备良好的敬业精神和团队合作精神,善于分析和解决问题,富有想象力和学习能力。
工作职责
1、负责多媒体理解领域的服务端开发工作,跟计算机视觉、音频、NLP等相关算法同学深入合作共同完成算法模型的服务化; 2、对后端服务进行各种维度的持续优化,推动机器资源使用率提升; 3、与其他同学合作设计并推动部门AI云服务平台的搭建。
1. 负责高德地图有业务场景包含但不限于:搜索推荐在线引擎建设、生成式大模型预训练、广告搜推及投放引擎设计、研发及调优工作; 2. 参与各专项技术调研,新技术引入等前瞻项目;
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于在蕴含丰富世界知识的预训练模型的基础上,利用post-train技术打造出能够服务人类的AI模型。通过RL、SFT、RFT等技术,探索大模型潜能的同时,塑造大模型的能力与性格。重点探索大模型的推理能力,实现深度思考,并致力于提升其 agent 能力,让大模型服务于真实世界的任务。 工作职责: 1. 探索更多可Scalable的Verifier信号,并通过RL提升模型的各项能力。 2. 提升reward model在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias。 3. 研究reasoning path压缩和外推,实现更高质量的推理思考。 4. 将LLM的推理能力和 agent以及其他模态相结合,探索统一模态的reasoning。
1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练; 2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节; 3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,持续优化多模态数据的存储以及检索效率。