logo of youku

优酷优酷-AIGC算法工程师(多模态理解)-北京

社招全职1年以上地点:北京状态:招聘

任职要求


1、计算机相关专业研究生及以上学历, 扎实的计算机视觉基础,扎实的计算机视觉、自然语言理解、或大模型相关的算法基础
2、熟悉大语言模型、或多模态大语言模型、或图像/视频的理解,在视频标注、视频评价、视频审核等方向上有相关的项目研发或落地经验
3、有较强的工…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、多模态大模型的后训练和强化学习,完成视频描述生成,视频打标等视频理解任务;
2、建立文生图、图生图、文生视频、图生视频的质量评价标准,研发高精度的评价模型;
3、参与风险内容检测和商业化审核的算法研发工作;
包括英文材料
学历+
OpenCV+
大模型+
算法+
Python+
还有更多 •••
相关职位

logo of baidu
实习MEG

-协助团队进行多模态大模型相关研究,包括高效微调、多模态理解对齐、玩法开发、幻觉消除、数据治理部署优化等相关工作 -参与项目的算法验证和优化,确保算法的效率和准确性 -协助进行文献调研,总结最新的技术趋势和研究进展 -参与团队内部的技术交流和分享会议

更新于 2025-04-29北京
logo of youku
社招

本岗位旨在通过多模态理解和生成技术,辅助影视设计和制作各流程的AI提效,具体职责包括但不限于: 1、多模态大语言模型的研究和应用,包括但不限于应用视频理解、视频评价,针对特定任务的有监督微调和强化学习等 2、图像/视频AIGC应用,包括图像/视频的可控编辑和生成等

更新于 2025-05-20北京
logo of alibaba
实习淘天集团日常实习

拍立淘是阿里电商核心视觉搜索算法团队,致力于为淘宝搜索核心业务打造行业领先的计算机视觉创新技术,应用于多种电商场景(如拍照搜同款、电商创意AIGC、电商大模型),堪称国内最大的视觉算法应用场景之一。我们紧随技术潮流,不断进行商业和技术创新,期待有志之士的加入,让算法发挥价值,让技术更有影响力。 【招聘方向】 1. AIGC视觉生成(包括但不限于可控图像/视频生成、图像/视频编辑、图像驱动、定制化、试衣等); 2.多模态大模型(包括但不限于大模型预训练、垂域微调SFT、RLHF、数据治理飞轮、训练部署加速等); 3.图像/多模态理解(包括商品多模态理解VG、目标检测、OCR、图像/多模态表征等),其他任何感兴趣/有价值的方向欢迎交流讨论。 【实习工作环境】 1. 充裕的GPU资源,近千张A100/V100 海量业务数据和基础能力积累,帮助高效产出; 2. 来自国内外top学校的师兄/师姐的倾力指导充分尊重实习生个人意见,自由度高; 3. 产研结合,支持鼓励实习生投递顶会论文。

更新于 2025-12-05北京|杭州
logo of amap
社招1年以上技术类-算法

团队简介: 我们是高德行中智能团队,我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的通用工程架构,打造有温度、有惊喜、科技感十足的下一代出行体验; 在这里,我们一起建设应对超大业务规模和场景,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索智慧出行最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成技术;基于语音、视觉、位置等多模态信息搭建高吞吐、低时延、强智能、真人感的Agent体系,打造全新人和环境交互形态; 职位描述 探索下一代多模态出行体验 基于全双工多模态agent,构建人和环境的全新交互形态

更新于 2025-12-01北京