快手多模态大模型智能体应用算法实习生

实习兼职D139182025-07-16地点：北京状态：招聘

扫码手机上打开

任职要求

1、对大模型的应用有丰富的兴趣，对主流大模型产品的优势和痛点有感知；
2、计算机、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们寻求具备大模型产品思维和创新能力的应用算法实习生，推动快手多模态大模型在内容生态、用户增长及商业化场景中的落地，构建行业领先的AI理解与应用平台，加速AI技术向业务价值的转化；
1. 负责各种接口、工具的调试、整理与设计，丰富大模型应用平台的技能包；
2. 构建快手场景下有用、可用、好用的大模型Agent，实现大模型能力的落地；
3. 跟进行业大模型产品进展，定期分享。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

学历+

相关职位

多模态大模型应用算法实习生-Seed

实习A246011A

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、多模态大模型Post-Training全链路优化：参与SFT、RL、Agent训练等核心算法的调优与创新，围绕搜索、教育、医疗等业务场景进行定向能力打磨，提升模型在真实任务中的效果与稳定性； 2、视频通话AI体验与多模态融合：参与视频通话基础AI能力的优化，包括视觉理解、长多轮对话、逻辑推理、联网搜索等；同时参与创新特性研发，如视频Memory、智能主动响应、音视频双工等，并推动多模态推理、智能体等技术在产品中的落地； 3、可穿戴硬件端AI能力与端云协同：协同优化端侧执行链路与服务端多模态模型的适配效果，打通端云协同流程，提升视频通话及硬件联动场景下的端到端体验； 4、手机助手基础体验与智能特性研发：参与手机助手的视觉理解、工具调用、跨应用任务规划等基础能力优化；同时参与手机Memory、GUI Agent、Intent理解等新特性的研究与落地，提升整体交互体验。

更新于 2026-01-26北京

大模型应用算法实习生-生活服务-筋斗云人才计划（北京/上海/成都）

实习A233498

团队介绍：生活服务业务依托于抖音、抖音极速版等平台，致力于促进用户与本地服务的连接。过去一年，生活服务业务开创了全新的视频种草和交易体验，让更多用户通过抖音发现线下好去处，也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入，一同为亿万用户创造更美好的生活。课题介绍：随着大模型技术的显著进展，智能体所能参与的场景想象力不断扩大。然而，现有智能体在面对复杂多变的实际应用场景时，仍存在诸多不足。一方面，用户对于交互的多样性和便捷性提出了更高要求，期望能够实现语音、图像、文本等多模态信息的自然交互；另一方面，面对复杂且陌生的问题，缺少泛化且置信的推理和规划能力，难以提供全面且精准的解答。同时，在知识获取方面，挖掘优质内容或主动咨询用户以满足用户的多样化需求，也成为亟待解决的问题。因此，开展对多模态交互、深度思考、规划调度、降低幻觉以及内容挖掘方向的研究，对于提升智能体的性能和用户体验具有重要的现实意义。课题方向： 1、多模态交互方向：深入研究语音、图像、文本等多模态信息的融合与交互技术，使智能体能够准确理解不同模态输入的含义，并根据用户需求以不同模态进行输出，实现自然流畅的交互体验； 2、深度思考方向：利用大模型的深度推理机制，提升智能体的逻辑推理、反思和问题解决能力。引入知识图谱等技术，增强智能体对知识的理解和运用能力，使其能够在面对复杂问题时，进行深度思考和分析，挖掘问题的本质，提供更具逻辑性和准确性的回答； 3、规划调度方向：构建智能工具调度系统，使智能体能够根据用户问题的类型和需求，自动识别并调用合适的内外部MCP工具，并自行设计工具调度的串并行顺序； 4、降低幻觉方向：大模型的幻觉会带来指令遵循能力差、回复生成质量低、执行流程错误等致命问题，严重影响用户对于智能体的信赖程度，需要被系统性地通过模型、架构、解决方案等多个层面去解决； 5、优质内容挖掘方向：研发高效的内容挖掘算法，从字节跳动站内外的海量的文本、图像、视频等数据中筛选出优质、有价值的信息。对内容进行分类、标注和评估，建立优质内容数据库。通过与智能体的交互，根据用户的兴趣和需求，定向挖掘优质内容，满足用户对高质量信息的获取需求。

更新于 2025-05-26成都

算法实习生-业务中台

实习A100975

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：团队负责公司多个跨产品业务方向，提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据、舆情、众包标注、中间件等多类型的中台能力与技术解决方案，积极利用AI等技术做中台能力提效与升级。加入我们，你将有机会从中台的多视角参与业务建设，感受不同类型/阶段的业务特点；通过投身亿级用户场景的开发&架构工作，学习和解决极富挑战的技术问题；你也可以从数据出发，积极利用策略和模型，为业务提供有价值的助力。 1、研究、创新、开发和优化最先进的大模型算法和智能体技术，如大模型数据合成、大模型后训练技术、多模态大模型、自主规划智能体、检索增强等； 2、精益求精，结合最新的深度学习框架，如TensorFlow、PyTorch等，不断优化和改进现有的大模型和智能体技术，通过Data Driven的方法不断提高模型的准确性和性能，达到最优状态； 3、研究和开发大模型应用技术，并落地字节跳动各业务场景； 4、跟进前沿的大模型和智能体技术，保持技术的领先。

更新于 2025-05-26北京

智能对话大模型算法实习生-电商智能对话-筋斗云人才计划（北京/上海/杭州/珠海）

实习A222718

团队介绍：Data-电商-智能对话团队，致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿，应用场景覆盖抖音电商全链路，包括平台客服、平台商服、商家客服、达人客服，以及创新的智能导购等核心业务场景，通过持续的技术创新和优化，成功构建了一套完整的智能对话解决方案，为电商业务带来了显著的效率提升和用户体验改善。课题介绍：背景：电商智能客服正逐渐成为业务增长和用户体验优化的重要方向，基于大型语言模型（LLM）的智能客服系统解决电商场景中的核心挑战，由LLM完成一次用户进线的完整接待过程，包括诉求澄清、方案协商、方案执行等阶段，实现电商业务的智能化升级——让用户享受更智能高效的客服服务。研究方向：本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体（Multi-Agent）框架，通过规划、回复、工具三类Agent的协作，实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度，避免模型生成幻觉或违背平台政策。同时，围绕电商客服的复杂任务，构建 Benchmark数据集，优化SOP遵循、多轮交互、用户满意度等指标。此外，研究高效数据利用方法，探索低标注数据条件下的LLM训练，并开发自动生成高质量训练数据的系统，以降低人工标注成本，提高智能客服的服务质量与效率。 1、数据挖掘：负责数据集的构建与维护，利用数据飞轮机制不断优化数据质量和丰富度，进行深度的数据挖掘，沉淀高价值信息； 2、大模型训练：针对业务需求进行大模型的继续训练（CT）、有监督微调（SFT）、偏好学习，以及多模态模型训练，提升模型在特定场景下的表现； 3、提示词工程：与业务专家合作，构建和优化结构化的提示词，充分挖掘和利用大模型的能力，高效、精准解决实际问题； 4、信息检索：开发和优化Query理解、召回、相关性排序等技术，提升信息检索的效率和准确性，提升RAG的效果； 5、智能体技术：利用领先的智能体框架，增强大模型的推理、对话和反思能力，解决复杂业务问题，提升用户体验； 6、大模型评测：制定和实施大模型的评估方案，结合人工评估和自动化评估手段，确保模型性能的可靠性和稳定性； 7、应用落地：定义业务问题，设定任务标准和目标，不断优化模型和系统，以达到最佳的业务效果和用户满意度。

更新于 2025-03-04上海