优酷优酷-多模态算法工程师-杭州
任职要求
1、计算机相关专业本科及以上学历,2年以上深度学习算法研究与开发经验; 2、具备多模态相关算法的扎实基础,包括但不限于自然语言处理、计算机视觉、视频理解、强化学习、LLM等领域的全面学习和实践经验; 3、熟悉主流的Bert/Transformer/GPT等预训练模型,熟练掌握Ten…
工作职责
1、负责优酷泛搜索和泛互动领域各业务场景下,多模态算法研究与应用落地工作,业务场景包括但不限于跨模态搜索/智能对话/文本创作/视频理解等; 2、跟踪多模态领域的最新研究成果,用以持续提升算法应用效果,研究方向包括但不限于多模态VLMs、LLMs等前沿技术; 3、深度参与产品研发项目,和产品经理/业务研发/业务质量/运营等同学密切配合,提高项目整体效率和收益。
1、跟进并实现视觉生成相关核心模块算法研发,并在可控场景下设计并实现业务生成方案与生成逻辑 2、解决文本生图、文本生视频的生成稳定性、一致性、可控性等核心问题 3、解决图像识别理解、图像审核、图像分类、图像分割等应用场景业务问题
1.负责电商领域多模态大模型的方案设计与落地,包括视觉-语言、视频-语言等方向的预训练、指令微调与对齐,在商品理解、内容理解/生成、内容审核、自动打标等多个淘天营销内容场景落地 2.构建电商多模态数据管线与数据质量治理体系,覆盖采集、清洗、标注、合成与去重,确保规模化训练的数据可用性 3.设计与实现多模态融合架构(如图像/视频/音频编码器、Connector/Q-Former等、跨模态注意力),提升跨模态理解与生成建模能力 4.进行指令微调与人类反馈强化学习(SFT、DPO、RLHF 等),完善人类偏好对齐,构建高质量评测与数据闭环 5.负责设计构建vlm加速相关算法方案,包括但不限于:模型剪枝、蒸馏、推理加速等

1. 负责智能互联多模态算法测试,熟悉算法工程全链路评测,可以独立设计如图像处理算法(如目标检测、图像识别、OCR等)的评测方案,数据集,评测工程等,确保算法精度与性能符合需求; 2. 建设通用的基于大模型场景下的模型评估体系、评测框架及基础评测能力的建设,包括评测集完备性,合理性建设,评测结果智能化判定,能够基于业务需求设计评测方案,开展多维度模型评估,输出专业评测报告; 3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行; 4. 协同项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。