小红书【REDstar】图像增强算法工程师
任职要求
1、本科及以上学历,计算机、通信工程、软件工程、数学或相关专业优先; 2、在图像、视频传统算法,深度学习、机器学习等人工智能领域有丰富经验, 具备扎实的图像处理算法基础, 有良好的数学功底; 3、在图像超分辨、图像修复、图像去噪、无参考质量评价等领域有丰富的经验,擅长跟踪最前沿的学术界和工业界的人工智能技术; 4、有利用图像算法和深度学习联合编码器优化经验者优先; 5、熟悉SD2.1/SD3.5/PixArt/FLUX等T2I模型及Wan等T2V模型,熟悉大模型基础原理,了解大模型微调技术,有diffusion生成式模型调优经验和落地经验者优先; 6、具备独立开展研究工作的能力,熟悉python语言,熟悉pytorch/tensorflow等深度学习框架,熟悉或了解c/c++; 7、有相关领域的会议或期刊(如CVPR, ICCV, TIP, TPAMI)发表经验者优先; 8、有良好的沟通表达能力和团队精神,自我驱动,结果导向,对前沿研究、学术发表和推动前沿算法在工业界落地感兴趣。
工作职责
1、负责视频/图片前处理修复增强算法的研究与落地,包括但不限于超分、降噪、去模糊、人像修复等; 2、负责在视频/图片画质还原领域探索diffusion生成式模型的应用与落地; 3、负责视频/图片画质分析和质量评估算法的研究和落地,包括但不限于噪声估计检测、低质检测(编码artifact/模糊/过锐)、色彩/曝光/对比度/清晰度评价、美学/构图评价等; 4、负责视频/图片场景分类和分析,用于改善视频编码效率和传输效率,包括但不限于ROI检测、场景分类、复杂度分析等。
1、 在音视频技术、人工智能、视频图像处理和生成等领域开展前沿技术研究,保持算法在工业界和学术界的领先; 2、 探索前沿技术在视频图像质量评估、视频图像分析及处理、智能编码、智能抽帧等技术方向上落地。
创意是内容的呈现方式,而文本、图像、视频和模版是创意的重要载体。探索文生图/图片编辑技术、文生视频/视频编辑技术和LLM/MLLM技术分别在增长、广告、营销、社区等领域的应用,生成质量高且有投放竞争力的素材。 1、负责 lmage-to-Video、Text-to-Video、Animation 等视频内容生成算法研发,从视频素材和视频创意玩法两个维度进行落地; 2、基于 Stable Diffusion 的图像内容研发,包括算法开发、模型微调、性能优化、模型服务化等工作,重点解决生成质量、多样性、可控性、可编辑等问题; 3、基于diffusion技术的创意元素生成,如海报、icon、banner、艺术字体、Layout、3D商品展示等; 4、解决业务落地中的关键技术问题,持续跟进业界AIGC 技术最新进展,加速新技术的引进、适配与优化。
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。