快手【快Star-X实习】AIGC视觉生成算法工程师
实习兼职J1007地点:北京状态:招聘
任职要求
1、硕士及以上学历,计算机、人工智能、数学等相关专业; 2、熟悉AIGC视觉生成的算法原理,具备扎实数理基础,对VAE、扩散模型、ViT等相关技术有理解和经验。熟悉至少一种主流的图像生成框架或算法,如Stable Diffusion、DALL·E、DiT、ControlNet等; 3、有技术追求,责任感强,具备较强的学习能力和动手能力,清晰的逻辑思维能力和出色的沟通能力,有强烈的好奇心。 加分项: 1、具有扎实的图像/视频生成算法基础,在AI领域顶会或期刊有论文发表经历优先; 2、在ACM ICPC等竞赛中有获奖经历优先; 3、参与知名图像/视频生成开源项目者优先。
工作职责
1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等; 2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题; 3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果; 4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
实习J1003
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
更新于 2025-05-30
校招J1007
深度优化多模态大模型的Caption、表征、改写能力,打造业界第一梯队的多模态大模型,在AIGC技术指标上超过GPT-4o、Gemini Pro等闭源模型,落地于快手各业务线。
更新于 2025-07-16
实习J1007
1、推进计算机视觉技术前沿探索,与这里经验丰富的技术同学一起,完成领先的新算法模型,解决业界新问题。 2、参与计算机视觉和人工智能的前沿技术研究工作,研究方向包括但不限于分类/检测/分割、多模态、视觉基础模型、3D视觉、AIGC、人像美化等方向。
更新于 2025-05-14