荣耀AIGC媒体生成算法高级工程师
任职要求
1. 数学/物理/自动化/计算机/电子工程/人工智能等相关专业; 2. 具有扎实的机器学习基础,熟悉AIGC媒体生成、3D内容生成等相关领域知识;或掌握图像视频生成基础算法,包括但不限于GAN、VAE、Diffusion等,了解Bayesian Learining相关知识; 3. 具备优秀的编码能力及扎实的数据结构/算法功底,掌握至少一种常用的深度学习框架(Pytorch/TensorFlow/C…
工作职责
1. 负责荣耀公司AIGC媒体生成能力构建并落地,设计并实现领域内关键技术方案,围绕具体业务场景,推动相关技术落地,包括但不限于文本生成图片或视频,2D内容风格化,3D物体、3D场景、数字人等; 2. 负责AIGC媒体生成领域前沿技术研究和竞品分析,保持对学术界和业界技术趋势的持续跟踪; 3. 负责将生成领域前沿技术及时、适时的进行转化和优化,构筑荣耀公司在业界的领先竞争力。
实习职责: 1. 参与多模态生成模型(如图像生成方向)的数据处理、基础训练及测试工作; 2. 将深度学习图形图像领域技术结合游戏场景进行创新研究; 3. 参与图像-文本数据集的整理、标注及质量评估; 4. 跟踪和复现部分前沿生成式AI相关论文或开源项目; 5. 配合团队完成技术调研、文档撰写及结果可视化展示。
部门介绍: 我们是阿里巴巴-高德的大模型和AIGC核心部门,承接公司的重点业务,包括本地生活场景中的广告创意、商品理解、内容智能创作和分发,出行场景的AI智能化等,研究领域广泛,包括但不限于多模态大模型、大语言模型、图像生成、图像编辑美化、视频生成和视频理解等,团队技术氛围好,成长空间大,拥有充足的研发资源和大量的业务应用数据,团队多篇论文入选paper digest最有影响力论文名单。团队聚焦于本地生活领域的广告和内容智能创作方向,技术栈包括,多模态大模型的理解和生成,视觉创意的可控生成,图像生成和编辑。通过在前沿技术领域的深耕,推动技术在内容智能创作(扫街榜)、广告视觉创意生成和多场景(搜推等)的内容的图文生成等方向的应用。我们正在寻找对技术有极致热情和专注的同学,在创建业务价值的同时,对前沿技术做创新的探索,共同做出有影响力的工作。 岗位职责: 1、跟踪并深入研究生成式AI领域的前沿技术,负责多模态媒体内容的理解、图像编辑以及图像生成、统一多模态理解和生成、强化学习等基础能力的研究和探索; 2、与团队成员合作,解决在本地生活领域的内容智能创作(扫街榜)以及广告创意等的应用中的算法难点,共同推动技术在实际业务中的应用和落地。
团队介绍: 我们团队聚焦于本地生活领域的广告和内容智能创作方向,技术栈包括,多模态大模型的理解和生成,视觉创意的可控生成,图像生成和编辑。通过在前沿技术领域的深耕,推动技术在广告视觉创意生成和多场景(搜推等)的内容的图文生成等方向的应用。我们正在寻找对技术有极致热情和专注的同学,在创建业务价值的同时,对前沿技术做创新的探索,共同做出有影响力的工作。 岗位职责: 1、跟踪和深入探索AIGC方向研究前沿,负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索,解决在内容智能创作以及广告创意等的应用中的算法难点,对算法的竞争力负责; 2、研究和应用计算机视觉(CV)等相关技术,熟悉多模态大模型或者图像编辑生成等方向的经典网络模型,了解各种常用网络训练方式及调优方式; 3、与团队成员合作,共同推动AIGC技术在实际业务中的应用和落地。
