快手(大模型专项)多模态内容理解算法工程师/专家 -【北京/杭州】
任职要求
1、硕士及以上学历,在计算机视觉多模态(CVPR,ICCV,ECCV、ACM等) 相关会议发表过论文优先; 2、对视频多模态方向有浓厚兴趣,有丰富应用经验; 3、对深度学习基础理论和大规模实践有较深理解; 4、精通至少一种技术语言,包括但不限于Java、C/C++、C#、Python等。
工作职责
1、负责快手多媒体内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频/直播内容体系建设、推荐、搜索的效果和体验; 2、负责快手多媒体相关的内容理解、语义理解的相关算法的研发,包括但不限于视频多分类、视频多标签、视频多模态embedding学习; 3、负责计算机多模态方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。
1、参与电商多模态大模型(MLLMs)的持续预训练和指令微调(SFT),开发精准的商品图谱、用户意图理解、跨模态检索等核心能力,赋能搜索、推荐等业务; 2、负责多模态生成算法(如Diffusion Models, VAEs等)的研发与创新,致力于解决生成内容的质量、多样性、可控性、可编辑性及采样效率等前沿问题; 3、基于大模型构建文本/图像/视频多模态创作引擎,并推动其在电商业务场景的产品化落地,包括但不限于背景替换、虚拟试衣、图生视频、海报生成等创新应用; 4、通过DPO/PPO等强化学习算法,迭代Reward Model以指导多模态素材生成,引导模型生成更符合人类偏好、审美标准及业务目标的多模态内容,最终提升用户体验和商品转化率。
1、负责多模态生成算法研发,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、负责端到端多模态生成式大模型的框架设计、训练与调优,构建基于生成模型的AI系统,推动多模态AIGC在快手各业务场景的产品化落地; 3、负责百亿/千亿参数量的多模态生成大模型研发,实现关键技术突破,并将前沿算法技术转化为创新产品。
我们是谁 快手本身是一家以内容为主的公司,在大模型技术蓬勃发展的时代,多模态能力是快手非常重视的一个方向。目前团队主要的工作重心在视频理解和图片理解,包括短视频、长视频、直播、交互式视频等,主要的任务形态以Caption和QA为主,同时在生成类场景发挥着重要的作用。团队的主要工作围绕在数据组织、模型设计、训练范式设计上,会推出基座模型给到下游业务进行SFT,部分业务是紧密合作的。模型迭代会以业务反馈作为牵引,不断提升在自建指标和公开指标上的成绩。 职位描述 1、探索多模态理解任务上的自研数据构建、模型架构和训练范式,打造业界第一梯队的多模态大模型; 2、搭建更有针对性的评测,用于真实反映模型的实用效果,为模型训练提供指导方向; 3、强化Caption和QA能力,在图片/视频的理解/描述能力上赶超GPT4o、Gemini Pro等闭源模型的实际使用效果; 4、洞察业务需求,能够以业务目标为牵引持续迭代模型,在支持好业务的同时,发掘多模态的独立出圈应用玩法; 5、探索技术边界,将有特点的技术成果进行学术转化,在顶尖学术会议上发表论文,并保持与业界专家的交流。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你可以基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑发布、比货、导购等多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用。工作内容包括模型结构设计、训练任务设计、预训练和下游能力建设等; 在这里,你将参与跟踪、探索大模型方向/多模态预训练方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。