快手(大模型专项)AIGC素材创意生成算法工程师/专家-【杭州】
任职要求
1、对CV、NLP、多模态等相关领域有深入的理解,在其中一个或多个方向有深入的研究经历,且有相关实际项目经验; 2、优秀的工程实践能力,熟悉pytorch/Tensorflow等深度学习框架,掌握大规模并行训练技术; 3、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力; 4、在国际会议发表论文者优先,包括但不限于ICLR、CVPR、ICCV、ECCV、ACL NeurIPS、ICML等会议。
工作职责
1、负责研发行业领先的AIGC素材创意生成技术,包括多模态理解、多模态检索、多模态生成等前沿技术,应用于电商、商业化、本地生活等场景的创意素材生成; 2、负责大模型(LLM、MLLM)的指令微调、RLHF等技术的深入探索与研发,提升文案内容的生成质量; 3、负责研发AIGC素材创意生成平台,实现自动化、智能化的素材创意内容的生成与推荐。
1. 预估方向:负责搜推广预估模型、校准相关方向的算法策略研发,包括特征体系和模型创新,负责深度学习模型在用户表征学习、召回模型、精排打分模型中的应用。 2. 机制方向:负责广告机制策略优化,基于深度学习与运筹优化的深度结合,优化出价机制策略,满足广告主多约束多目标的保量投放需求,同时提升客户效果与平台收益;构建多目标约束优化框架(如收入、广告主留存、生态公平性)建设生态健康的广告系统。 3. 创意方向:负责搜索广告动态创意模型策略算法优化工作:使用AIGC大模型根据客户营销信息,结合流量特征生成广告创意物料,提升广告创意物料供给的质量和营销效果;负责搜索广告创意物料-样式组合优选模型:多模态创意-物料素材组合优选,为搜索广告选择最优创意物料和样式组合,进而提升广告营销效果。 4. 流量增长:负责高德端内商业化广告流量的增长,具体包括:在搜索引导、Query推荐等核心场景中,通过端内用户行为的分析和挖掘,自动挖掘高价值广告供给和Query数据,结合在线实时识别与预估用户需求,主动进行精准化引导与分发,从而实现商业化广告流量的高效提升。 5. NLP/相关性方向:负责搜索广告的Query理解、触发、bidword推荐、文本匹配、Query推荐等相关工作,熟悉并掌握主流的NLP算法,在保障广告用户体验的前提下,提升广告收
1、参与电商多模态大模型(MLLMs)的持续预训练和指令微调(SFT),开发精准的商品图谱、用户意图理解、跨模态检索等核心能力,赋能搜索、推荐等业务; 2、负责多模态生成算法(如Diffusion Models, VAEs等)的研发与创新,致力于解决生成内容的质量、多样性、可控性、可编辑性及采样效率等前沿问题; 3、基于大模型构建文本/图像/视频多模态创作引擎,并推动其在电商业务场景的产品化落地,包括但不限于背景替换、虚拟试衣、图生视频、海报生成等创新应用; 4、通过DPO/PPO等强化学习算法,迭代Reward Model以指导多模态素材生成,引导模型生成更符合人类偏好、审美标准及业务目标的多模态内容,最终提升用户体验和商品转化率。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper