快手AI应用算法工程师(AIGC方向)-【商业化】
社招全职1-3年J0011地点:北京状态:招聘
任职要求
1、计算机、人工智能、数学相关专业; 2、熟悉大模型的相关基础知识,具备大语言模型相关训练或推理的基础知识;具备通过demo快速验证想法的能力; 3、熟悉LLM的训练或Fine-tuning的方法,例如SFT/RLHF经验,或熟悉强化学习(RL)概念深入了解DPO、PPO相关算法知识; 4、扎实的Python或者C++编程功底,了解…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、大模型研发与微调:负责面向小说创作场景的大语言模型(LLM)SFT及RLHF;针对文学创作特性,优化模型在中长文本生成、剧情逻辑连贯性及文风模仿上的表现; 2、场景化应用落地:深入理解网文/出版业务流,将大模型能力转化为辅助写作、自动续写、剧情大纲生成、多分支互动小说等具体产品功能,构建从灵感到小说正文的AIGC生产管线; 3、长文本与一致性控制:攻克长上下文理解与生成的技术难点,利用记忆机制、知识图谱或Agent架构,解决小说创作中人物设定、世界观、剧情伏笔的长期一致性问题; 4、评估体系与前沿探索:跟进业界最新的LLM架构(如MoE、Attention优化)及Agent技术,通过技术创新提升内容生产效率和质量。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
RLHF+
[英文] What is RLHF?
https://aws.amazon.com/what-is/reinforcement-learning-from-human-feedback/
Reinforcement learning from human feedback (RLHF) is a machine learning (ML) technique that uses human feedback to optimize ML models to self-learn more efficiently.
https://www.ibm.com/think/topics/rlhf
Reinforcement learning from human feedback (RLHF) is a machine learning technique in which a “reward model” is trained with direct human feedback, then used to optimize the performance of an artificial intelligence agent through reinforcement learning.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招D13110
1、负责快手AIGC应用工程各内外部产品后端系统、平台系统的研发工作,同算法、产品团队协作,支持业务需求快速迭代,不断优化系统架构,支撑业务规模增长,保障服务稳定; 2、参与建设AIGC视频生成的工程能力,结合多模态大模型能力,进行生产链路串联和编排,实现高质量AIGC视频的大规模生产; 3、参与构建数字员工通用能力,在对话效果、知识挖掘、多模态识别等方向持续提升数字员工效果,实现数字员工对各业务场景的高效支持; 4、参与AI应用效果优化和评测体系建设,结合业务实际情况制定数据分类和存储方案,通过高质量AI效果支持业务快速发展。
更新于 2025-05-20北京
社招1-3年J0012
参与品牌营销AI算法相关工作,构建AIGC、B/C端等智能服务的数据飞轮,主要工作涉及: 1、 用户数据分析和策略制定:分析用户交互数据和转化数据,评估不同商业内容下用户的转化情况,制定优化策略; 2、 优化模型生成效果:负责模型训练数据构建与管理,参与数据筛选、标注及评测体系构建工作。分析和挖掘现有数据资源,通过数据驱动的方法优化,结合A/B测试等手段验证调整效果。
更新于 2026-02-28北京
社招3-5年J0012
1、负责广告业务中大模型能力的研发与落地,包括广告商品识别、广告素材生成、智能创编、智能助手等核心场景; 2、深入挖掘广告内容、商品信息、用户行为等多模态数据,构建高质量训练语料与知识库,驱动多模态/多任务大模型能力升级; 3、研究并应用先进的大模型训练技术(如SFT、LoRA、RLHF、Prompt Engineering等),构建面向广告场景的垂类大模型; 4、推动大模型在广告行业中的文本、内容可控生成等关键问题的算法突破; 5、跟踪前沿AI技术,推动AIGC与广告业务结合的创新应用,提升投放效率与用户体验; 6、跨团队协作,推动算法方案在广告平台、创意平台等系统中的落地与优化。
更新于 2026-02-10北京|杭州