快手(大模型专项)计算机视觉算法工程师(北京)
任职要求
1、计算机/数学相关方向硕士及以上学历,发表过高水平论文者优先; 2、对CV算法和理论有深入理解,有实际CV相关项目落地经验者优先;…
工作职责
负责计算机视觉相关的算法研发(包括但不限于识别、分割、生成式AI、3D视觉等)。将前沿的CV技术与快手丰富的业务场景结合,被上亿用户所使用。
1、负责快手多媒体内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频/直播内容体系建设、推荐、搜索的效果和体验; 2、负责快手多媒体相关的内容理解、语义理解的相关算法的研发,包括但不限于视频多分类、视频多标签、视频多模态embedding学习; 3、负责计算机多模态方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。
1、研发行业领先且实用的AIGC视觉生成大模型技术,包括AIGC视觉生成大模型、文生图、图生图、保ID的可控编辑、图文/视频多模态理解及生成技术落地; 2、构建完整的AIGC视觉生成系统链路,推动在快手创作/消费/搜索/商业化/AI生产工具等场景的规模应用,实现AIGC关键技术突破、极致打磨效果体验,在各业务场景创作用户价值; 3、负责AIGC技术及产品效果创新,持续打造业界的技术口碑及影响力。
1、负责多媒体理解领域的服务端开发工作,跟计算机视觉、音频、NLP等相关算法同学深入合作共同完成算法模型的服务化; 2、对后端服务进行各种维度的持续优化,推动机器资源使用率提升; 3、与其他同学合作设计并推动部门AI云服务平台的搭建。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1、提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,负责模型结构设计、训练任务设计、预训练和下游能力建设等; 2、基于淘天用户丰富的消费行为,打造技术先进的电商用户理解多模态大模型,提升对用户的异构行为本质的认知能力; 3、通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解任务上实现sota; 4、跟踪、探索大模型方向/多模态预训练方向的前沿技术,通过后训练强化学习提升多模态对齐、多模态推理思考能力,提升下游任务的效果。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper