快手【快Star-X】大模型创作智能体算法工程师
校招全职J1001地点:北京状态:招聘
任职要求
1、数学、计算机、控制科学、软件工程、人工智能等相关学科,硕士研究生及以上学历; 2、熟悉大模型的相关基础知识,具备大语言模型相关训练或推理的基础知识; 3、熟悉LLM的训练或Fine-tuning的方法,例如SFT/RLHF经验,或熟悉强化学习(RL)概念深入了解DPO、PPO相关算法知识; 4、有大模型对齐项目经验,有agent开发、优化经验者优先; 5、扎实的P…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、从事大模型智能体(LLM Agent)的研究; 2、为大模型设计新的记忆系统、工具利用、环境交互、规划、反思等机制,探索复杂任务中的强化学习方法,扩展大模型解决复杂问题的能力边界; 3、开发和优化智能创作Agent,提升其指令遵从能力、安全性和创作能力,打造行业领先的智能创作Agent; 4、前沿算法技术的持续跟踪和创新,包括但不限于代码生成、视频创作、多智能体系统、强化学习、数据合成等领域; 5、参与孵化与智能体技术相关的新产品。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
校招J1020
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
更新于 2025-06-24北京
实习J1020
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
更新于 2025-04-30北京
校招大模型
1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到机器翻译、多语言理解等小红书国际化实际的业务场景中; 2、结合业务场景,探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案,提升海外多语言用户的搜索和推荐基础体验; 3、基于成熟的AI平台服务,构建AI搜索、素材智能创作等完善的AI原生应用和X+AI应用,打造具有核心用户价值的热点应用。
更新于 2025-11-18北京|上海|杭州