vivoAIGC影像算法工程师(相册方向)-实习
任职要求
1、硕士及以上学历,计算机视觉、人工智能、电子工程、数学等相关专业; 2.、至少1年以上计算机视觉或图像生成方向经验,具备以下任一方向者优先: (1)多模态生成与理解(图像/文本/视频/3D); (2)AIGC技术:Stable Diffusion、GAN、VAE、DiT、LoRA、CLIP、LLM 等; (3)图像增强:图像超分、图像复原、画质评价、风格迁移; (4) RLHF、LLM微调、长尾样…
工作职责
1、跟进业界 AIGC(SD、GAN、LLM等)在图像生成、编辑、理解等方向的前沿进展,探索图像、文字、视频等多模态生成与编辑技术; 2、负责手机相册场景下的图文生成、图像画质增强、图像超分、风格迁移、可控编辑、长尾数据合成、幻觉抑制等 AIGC 相关算法的设计与优化; 3、参与 Camera 拍照、视频等图像相关算法的研发与异构部署工作,包括但不限于 3A、画质、人像算法、多模态理解算法等; 4、结合业务场景,提出具有通用性或定制化的算法解决方案,推动算法在实际产品中的落地; 5、参与大规模模型的训练与部署,持续优化模型性能与推理效率,提升整体用户体验; 6、持续进行算法创新,解决关键问题,提升团队整体技术能力。
方向一:负责针对相机的计算成像算法的开发和迭代: 1.负责基础图像算法如3R(NoiseReduction, SuperResolution, HDR), 多帧多摄等。 2.负责图像后处理算法如美颜、色彩映射,图像渲染等。 3.负责软硬件结合图像算法如ISP(Image signal processor)算法的开发调优,负责白平衡、自动对焦、自动曝光控制、色彩还原、多摄立体视觉、防抖算法的迭代进化等。 方向二:利用机器学习、深度学习、模型压缩及小型化等AI技术,解决Low-level画质处理、语义理解等技术问题,并实现技术的工程化部署。 方向三:负责相关算法在Android计算平台和手机soc上部署的架构设计和复杂度优化,达到实际产品应用要求。 方向四:探索大模型、AIGC在影像和相册领域的落地场景,开发与实际业务结合的垂类大模型,并进行模型小型化,使其能够运行在手机设备上。
方向一:负责针对相机的计算成像算法的开发和迭代: 1.负责基础图像算法如3R(NoiseReduction, SuperResolution, HDR), 多帧多摄等。 2.负责图像后处理算法如美颜、色彩映射,图像渲染等。 3.负责软硬件结合图像算法如ISP(Image signal processor)算法的开发调优,负责白平衡、自动对焦、自动曝光控制、色彩还原、多摄立体视觉、防抖算法的迭代进化等。 方向二:利用机器学习、深度学习、模型压缩及小型化等AI技术,解决Low-level画质处理、语义理解等技术问题,并实现技术的工程化部署。 方向三:负责相关算法在Android计算平台和手机soc上部署的架构设计和复杂度优化,达到实际产品应用要求。 方向四:探索大模型、AIGC在影像和相册领域的落地场景,开发与实际业务结合的垂类大模型,并进行模型小型化,使其能够运行在手机设备上。
1、研发生成式AI模型(如Diffusion Model/GAN等),推动AI生成内容(AIGC)在手机影像中的创新应用,涵盖图像生成、增强、风格化等领域; 2、优化AIGC算法在移动端的实时性与能效,支持文字到图像、图像到图像等多模态生成任务; 3、探索AIGC与手机影像技术的深度结合,解决暗光增强、超分辨率、人像生成、影调风格、可控编辑等场景的算法难题; 4、跟踪业界、学术界前沿技术趋势,输出高价值专利与算法原型,支撑公司AI影像技术领先性。

达摩院医疗AI实验室基础技术团队通过研究计算机视觉技术来解决医疗影像AI中的科学和应用难题,团队成员主要来自国内外知名视觉实验室或者医疗影像AI实验室,且曾获得过斯坦福大学全球top2%顶尖科学家,清华大学AMiner AI Top2000等荣誉。近五年团队在CVPR/ICCV/NeurIPS/ICLR/ICML/TPAMI/IJCV等顶会顶刊发表论文超百篇,并曾获CVPR 2022 Best Student Paper奖项。目前,达摩院医疗AI实验室“一扫多筛”产品已经在多家医疗成功落地,多篇相关成果在nature medicine发表。但是,医疗数据相比通用数据获取和标注难度大得多,医疗数据稀缺问题依然是行业未解的难题。为了解决该难题,我们正在研发医疗领域的“SORA”模型,构建医疗影像数据生成的基础生成模型。我们期待该模型能够高度可控合成高质量医学影像数据,从而解决数据稀缺、数据质量良莠不齐、数据标注成本高昂、多中心分布差异、罕见病例难获取、预测病灶演变、影像质量增强等一系列医疗影像数据难题。我们欢迎视觉背景和医疗影像AI背景的英才加入团队,与我们一起将医疗AI推入基础大模型时代。 1. 负责医疗影像生成基础模型及其下游影像合成应用算法研发,包括但不限于基础模型训练、生成模型post-training算法、病灶合成算法、影像增强算法、罕见病影响合成算法、生成算法训练推理优化、生成理解一体化等。 2. 负责医疗影像数据的分析和处理,通过分析影像本身和对应的影像报告挖掘其中高质量的信息,为生成算法提供数据基础。 3. 推动算法落地,与医院和医生保持沟通合作,分析应用场景中的算法问题,能够根据具体问题选择并设计合适的模型和技术方案。 4. 持续视觉和医疗影像AI前沿技术与发展热点,产出高水平论文,建立行业影响力。