logo of kuaishou

快手【快Star-X】多模态大模型算法工程师-AIGC

校招全职J1007地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、数学或统计学相关专业;
2、对基于图像、视频、语音、文本等模态内容的各类算法有一定的理解,并在如下一个或多个相关方向有相关研究经历: GAN 、扩散模型、图像生成、多模态等;
3、具备扎实的编程功底,熟悉 Pytorch 等主流深度学习框架,熟练使用 C ++/ Python 等至少一种编程语言,熟悉 Linux 开发环境; 
4、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力。

工作职责


1、了解多模态内容生成相关算法,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题;
2、了解端到端多模态生成式大模型的框架设计、训练与调优,构建基于生成模型的AI系统,推动多模态AIGC在快手各业务场景的产品化落地。
包括英文材料
学历+
算法+
PyTorch+
深度学习+
C+
Python+
Linux+
相关职位

logo of kuaishou
校招J1006

1、探索和打造下一代 AI 驱动的广告生成、推荐与竞价系统。致力于将 AIGC、大语言模型(LLM)、多模态大模型(MLLM)、博弈论以及强化学习(RL)等前沿技术,应用于业务的各个核心环节,提升平台商业效率与用户体验。 2、参与端到端大模型应用系统的设计与落地,涵盖模型训练、算法优化、系统部署及业务集成; 3、深入研究大模型在广告创意生成、广告推荐、机制设计、用户建模、Query建模、智能竞价等领域的创新应用; 4、与业务、产品、系统、平台等多团队紧密合作,在真实超大规模数据和复杂业务场景中打磨技术; 5、持续跟进行业前沿技术,探索具备商业价值与学术创新的解决方案,推动技术落地与规模化应用。

更新于 2025-06-24
logo of kuaishou
校招J1003

1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。

更新于 2025-07-07
logo of kuaishou
实习J1003

1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。

更新于 2025-05-30
logo of kuaishou
校招J1020

1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。

更新于 2025-06-24