logo of honor

荣耀AIGC媒体生成算法高级工程师

校招全职研发类地点:上海 | 深圳 | 西安状态:招聘

任职要求


1. 数学/物理/自动化/计算机/电子工程/人工智能等相关专业;
2. 具有扎实的机器学习基础,熟悉AIGC媒体生成、3D内容生成等相关领域知识;或掌握图像视频生成基础算法,包括但不限于GAN、VAE、Diffusion等,了解Bayesian Learining相关知识;
3. 具备优秀的编码能力及扎实的数据结构/算法功底,掌握至少一种常用的深度学习框架(Pytorch/TensorFlow/Caffe),掌握DeepSpeed、Accelerate等加速框架,具备独立复现SOTA论文的能力,熟练使用Python,掌握C++/C/Java中至少一种者优先;
4. 优秀的分析和解决问题的能力,对挑战性问题充满激情,在进入新领域时有自我学习的能力和驱动力;
5. 以下一种或多种情况优先:
a)在校期间参加过企业合作,有过开发落地经验者;
b)在顶刊顶会发表过相关论文,或在高水平竞赛中获奖者。

工作职责


1. 负责荣耀公司AIGC媒体生成能力构建并落地,设计并实现领域内关键技术方案,围绕具体业务场景,推动相关技术落地,包括但不限于文本生成图片或视频,2D内容风格化,3D物体、3D场景、数字人等;
2. 负责AIGC媒体生成领域前沿技术研究和竞品分析,保持对学术界和业界技术趋势的持续跟踪;
3. 负责将生成领域前沿技术及时、适时的进行转化和优化,构筑荣耀公司在业界的领先竞争力。
包括英文材料
机器学习+
算法+
数据结构+
深度学习+
PyTorch+
TensorFlow+
Python+
C+++
C+
Java+
相关职位

logo of amap
社招3年以上技术类-算法

部门介绍: 我们是阿里巴巴-高德的大模型和AIGC核心部门,承接公司的重点业务,包括本地生活场景中的广告创意、商品理解、内容智能创作和分发,出行场景的AI智能化等,研究领域广泛,包括但不限于多模态大模型、大语言模型、图像生成、图像编辑美化、视频生成和视频理解等,团队技术氛围好,成长空间大,拥有充足的研发资源和大量的业务应用数据,团队多篇论文入选paper digest最有影响力论文名单。 岗位职责: 1、负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索,解决在内容智能创作以及广告创意等的应用中的算法难点; 2、研究和应用计算机视觉(CV)等相关技术,熟悉多模态大模型或者图像编辑生成等方向的经典网络模型,了解各种常用网络训练方式及调优方式; 3、前沿技术探索:跟踪和深入探索技术研究前沿,提出创新性方案,形成论文或者专利。

更新于 2025-09-11
logo of amap
实习高德地图2026

团队介绍: 我们团队聚焦于本地生活领域的广告和内容智能创作方向,技术栈包括,多模态大模型的理解和生成,视觉创意的可控生成,图像生成和编辑。通过在前沿技术领域的深耕,推动技术在广告视觉创意生成和多场景(搜推等)的内容的图文生成等方向的应用。我们正在寻找对技术有极致热情和专注的同学,在创建业务价值的同时,对前沿技术做创新的探索,共同做出有影响力的工作。 岗位职责: 1、跟踪和深入探索AIGC方向研究前沿,负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索,解决在内容智能创作以及广告创意等的应用中的算法难点,对算法的竞争力负责; 2、研究和应用计算机视觉(CV)等相关技术,熟悉多模态大模型或者图像编辑生成等方向的经典网络模型,了解各种常用网络训练方式及调优方式; 3、与团队成员合作,共同推动AIGC技术在实际业务中的应用和落地。

更新于 2025-04-29
logo of sohu
社招智能媒体研发中心

1、负责文本生成大模型的构建与迭代,形成通用内容形式的泛用生成能力,针对媒体业务中的内容生产、运营、分发等环节提供基础能力支持; 2、从事图像、视频领域的内容生成算法研发工作,开放面向C端的AIGC能力,降低用户的能力使用门槛; 3、负责自然语言、图像、视频的处理相关算法研发工作,丰富化内容理解的手段,赋能搜狐网/搜狐视频的推荐场景; 4、强化图分析算法能力,完善内容生态网络和业务知识图谱建设,挖掘媒体内容生态中的潜在价值点。

更新于 2025-08-19
logo of bytedance
校招A54167A

团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:随着4K、HDR等技术成为主流标准,消费者对视频画质的要求日益提升。然而,视频在拍摄、传输和压缩过程中,画质往往受损,影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性,因此希望能够探索多模态大模型在多媒体场景的应用可行性,发掘基座大模型在大规模业务视频内容应用的潜力,建立业内领先的多媒体场景的多模态大模型解决方案。 画质分析以及人眼感知:利用多模态大模型,深入分析视频内容及画质退化问题,研究人眼对色彩、帧率、清晰度等画质维度的感知能力,从而使得画质评估更为准确,画质增强对退化的处理更为智能,增强的结果更符合人眼主观。生成式画质增强:利用生成式大模型的先验信息,大幅提升画质增强的效果天花板,并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务:研究画质理解和增强在视频上的拓展,包括时域信息表征建模,时域退化理解,时域画质增强连续性,时域推理加速等。用户视角的验证:在大规模用户环境中,从用户的实际观看体验出发,验证画质增强算法的有效性和用户满意度。 1、支持研发基于大模型的多媒体算法,包括但是不限于视频理解,质量评价、视频处理和增强以及视频压缩; 2、支持多模态大模型相关算法的性能优化以及加速; 3、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 4、支持多模态大模型相关的前沿学术研究,在国际顶级会议与期刊中发表成果。

更新于 2025-05-26