荣耀影像算法工程师(AIGC方向)
任职要求
1、学历和专业要求:本科及以上学历,计算机科学、人工智能、数学、物理等相关专业; 2、工作经验要求:有2年以上图像处理、计算机视觉算法开发经验,熟悉主流生成框架(如Stable Diffusion、DALL-E等),了解模型压缩与移动端推理优化技术(如ONNX、TensorRT); 3、技能要求:精通Python,熟悉PyTorch/TensorFlow,具备C++工程化能力及多线程优化经验;对用户需求敏感,能通过算法创新提升影像创作自由度与趣味性; 4、个人能力要求:具备较强的逻辑思维能力、学习能力及跨团队协作能力,能快速理解产品需求,输出系统性解决方案。
工作职责
1、研发生成式AI模型(如Diffusion Model/GAN等),推动AI生成内容(AIGC)在手机影像中的创新应用,涵盖图像生成、增强、风格化等领域; 2、优化AIGC算法在移动端的实时性与能效,支持文字到图像、图像到图像等多模态生成任务; 3、探索AIGC与手机影像技术的深度结合,解决暗光增强、超分辨率、人像生成、影调风格、可控编辑等场景的算法难题; 4、跟踪业界、学术界前沿技术趋势,输出高价值专利与算法原型,支撑公司AI影像技术领先性。
1、跟进业界 AIGC(SD、GAN、LLM等)在图像生成、编辑、理解等方向的前沿进展,探索图像、文字、视频等多模态生成与编辑技术; 2、负责手机相册场景下的图文生成、图像画质增强、图像超分、风格迁移、可控编辑、长尾数据合成、幻觉抑制等 AIGC 相关算法的设计与优化; 3、参与 Camera 拍照、视频等图像相关算法的研发与异构部署工作,包括但不限于 3A、画质、人像算法、多模态理解算法等; 4、结合业务场景,提出具有通用性或定制化的算法解决方案,推动算法在实际产品中的落地; 5、参与大规模模型的训练与部署,持续优化模型性能与推理效率,提升整体用户体验; 6、持续进行算法创新,解决关键问题,提升团队整体技术能力。
1、负责研发基于扩散模型的图生图技术应用在下游任务中,比如人像增强技术、去模糊、影调迁移等; 2、负责研发高质量摄影级别的图生视频技术例如Face vid2vid、LivePortrait、Hallo 、Sadtalker、EMO、AnimateDiff ; 3、在导师指导下发表前沿学术论文,撰写专利,探索AIGC在突破图像处理效果上的可行性。
1、研发智能体算法,提升手机影像系统中模块化组件的自动化决策能力(如场景识别、参数调优、算力分配),包括不限于多智能体协同,混合专家模型,多模态通才模型,视频理解模型开发; 2、场景理解类算法研发工作,辅助智能体、拍照、3A等下游算法的输入; 3、设计面向复杂场景的自主理解决策,优化拍摄全链路的任务调度与资源协同(如AI构图、拍照链路决策,拍照场景智能问答); 4、构建基于强化学习/RAG技术智能体框架,提升相机的智能体验,提升剪辑效率,提升用户出片率; 5、探索Agent技术与3A/AIGC/ISP等算法的深度融合,推动影像系统从“被动响应”向“主动创作”演进。