logo of kuaishou

快手智能创作Agent算法工程师-【可灵AI】

实习兼职D13925地点:北京状态:招聘

任职要求


1、具备扎实的编程能力,熟悉数据结构算法,有ACM/ICPC、Kaggle等竞赛经历者优先;
2、对自然语言处理计算机视觉、多模态学习等方向有基础了解,熟悉大模型相关原理,有项目经验更佳;
3、熟悉多模态大模型(VLM)、大语言模型(LLM)相关的算法技术,在相关领域有课程项目、科研或开源实践经验,了解大模型数据构造方法、Post Training算法;
4、了解LLM架构,熟悉强化学习算法(GRPO、PPO、DPO、判别式及生成式RM)、Multi-Agent 技术、Prompt/Context Engineering 等工程方法,有AI Agent应用或AIGC实操经验者优先;
5、对前沿技术保持好奇心,具备快速学习能力,善于思考和创新,能够将研究与业务问题结合。
加分项:
1、有大模型或生成式AI相关实习/科研/竞赛经历;
2、在 GitHubKaggle 或 ArXiv 等平台有项目/作品/论文;
3、对视频剪辑、美学分析、创意生成等方向有浓厚兴趣。

工作职责


1、参与智能创作Agent核心系统的研发与迭代,学习如何融合多模态理解、交互与生成能力,探索AI在内容创作中的应用场景;
2、协助搭建创作领域的多模态认知体系,结合行业知识库,理解镜头美学、剪辑节奏、叙事逻辑等要素,支持图片/视频/音乐生成模型的优化与应用;
3、参与大模型后训练相关探索(如SFT、RLHF 等),通过高质量数据合成、指令设计、偏好对齐等方法,提升Agent的长推理和复杂规划能力;
4、参与Agent相关核心模块的开发与实验,包括任务编排、工具调用、多Agent协作、长期记忆和个性化能力探索。
包括英文材料
数据结构+
算法+
Kaggle+
NLP+
OpenCV+
大模型+
强化学习+
AI agent+
Prompt+
GitHub+
相关职位

logo of kuaishou
校招J1020

1、基于快手自研的文生视频(可灵)、文生图(可图)、文生文(快意)等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。

更新于 2025-07-30
logo of kuaishou
实习J1020

1、基于快手自研的文生视频(可灵)、文生图(可图)、文生文(快意)等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并于算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。

更新于 2025-05-14
logo of quark
校招智能信息秋季20

夸克智能体团队致力于建设高度自主的大规模 AI Agent 系统,基于领先的工程基础与业务生态,已实现多领域多模态智能体的落地应用,在 AI 搜索、医疗健康、知识问答、智能创作、办公效率等核心场景形成深度应用。 我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,您将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品。

更新于 2025-08-13
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-08-18