优酷优酷-AIGC多模态算法工程师-杭州/北京
任职要求
在职要求: 1、计算机、自动化、数学等相关专业硕士、博士,有机器学习和深度学习相关经验,具有优秀的理解力与执行力 2、有匹配的CV算法工作经验,熟悉检测、分割、分类、生成等模型与应用场景 3、熟悉Linux系统,熟练使用Java/C++/Python其中任一编程语言,以及TensorFlow/Pyto…
工作职责
1、跟进并实现视觉生成相关核心模块算法研发,并在可控场景下设计并实现业务生成方案与生成逻辑 2、解决文本生图、文本生视频的生成稳定性、一致性、可控性等核心问题 3、解决图像识别理解、图像审核、图像分类、图像分割等应用场景业务问题
1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天用户丰富的消费行为,打造技术先进的电商用户理解大模型,提升对用户的异构行为本质的认知能力,支撑用户个性化的搜索、商详、互动等多种电商业务场景; 4. 基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用; 5. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题介绍: 背景:电商领域短视频内容正逐渐成为业务增长和用户体验优化的重要方向,通过多模态的视频理解与生成大模型创新解决电商场景中的核心挑战,例如短视频与电商商品的精准匹配、AIGC(AI生成内容)视频生成等,让用户在浏览短视频时获得更精准的商品匹配,并为内容创作者提供更便捷强大的创作工具。 研究方向:本课题聚焦于多模态视频理解与生成。构建高效的多模态嵌入模型,实现视频、图像、文本、商品等模态间的统一表示学习,以增强短视频与电商商品的关联性。通过大规模跨模态数据集的构建与优化,提升视频与商品的匹配精准度,使模型能够自动识别短视频中的商品或品牌,并精准映射至电商库,支持用户在观看时直接获取相关购买信息。此外,还将探索 AIGC(AI生成内容)短视频技术,包括商品图像+文本生成带货视频、智能剪辑与特效添加、虚拟试穿等,降低电商内容制作成本,提升营销效率。 1、负责对电商场景下的商品内容、视频内容进行理解和可控生成,赋能电商全链路场景,提供优质商品供给、内容供给、商家、达人供给等,建立商品履约视角的商品理解算法体系,为商品履约保驾护航,提升购物体验; 2、基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等),利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 3、挖掘电商垂直领域大规模、高质量Pretrain数据集,基于字节跳动通用大模型,研发电商行业大模型,探索电商交互式导购新场景; 4、跟踪AIGC/CV/NLP/多模态/LLM领域的最新研究和技术发展,负责算法模型迭代升级。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。