快手多模态大模型智能体应用算法实习生
任职要求
1、对大模型的应用有丰富的兴趣,对主流大模型产品的优势和痛点有感知; 2、计算机、…
工作职责
我们寻求具备大模型产品思维和创新能力的应用算法实习生,推动快手多模态大模型在内容生态、用户增长及商业化场景中的落地,构建行业领先的AI理解与应用平台,加速AI技术向业务价值的转化; 1. 负责各种接口、工具的调试、整理与设计,丰富大模型应用平台的技能包; 2. 构建快手场景下有用、可用、好用的大模型Agent,实现大模型能力的落地; 3. 跟进行业大模型产品进展,定期分享。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、多模态大模型Post-Training全链路优化:参与SFT、RL、Agent训练等核心算法的调优与创新,围绕搜索、教育、医疗等业务场景进行定向能力打磨,提升模型在真实任务中的效果与稳定性; 2、视频通话AI体验与多模态融合:参与视频通话基础AI能力的优化,包括视觉理解、长多轮对话、逻辑推理、联网搜索等;同时参与创新特性研发,如视频Memory、智能主动响应、音视频双工等,并推动多模态推理、智能体等技术在产品中的落地; 3、可穿戴硬件端AI能力与端云协同:协同优化端侧执行链路与服务端多模态模型的适配效果,打通端云协同流程,提升视频通话及硬件联动场景下的端到端体验; 4、手机助手基础体验与智能特性研发:参与手机助手的视觉理解、工具调用、跨应用任务规划等基础能力优化;同时参与手机Memory、GUI Agent、Intent理解等新特性的研究与落地,提升整体交互体验。
团队介绍:生活服务业务依托于抖音、抖音极速版等平台,致力于促进用户与本地服务的连接。过去一年,生活服务业务开创了全新的视频种草和交易体验,让更多用户通过抖音发现线下好去处,也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入,一同为亿万用户创造更美好的生活。 课题介绍: 随着大模型技术的显著进展,智能体所能参与的场景想象力不断扩大。然而,现有智能体在面对复杂多变的实际应用场景时,仍存在诸多不足。一方面,用户对于交互的多样性和便捷性提出了更高要求,期望能够实现语音、图像、文本等多模态信息的自然交互;另一方面,面对复杂且陌生的问题,缺少泛化且置信的推理和规划能力,难以提供全面且精准的解答。同时,在知识获取方面,挖掘优质内容或主动咨询用户以满足用户的多样化需求,也成为亟待解决的问题。因此,开展对多模态交互、深度思考、规划调度、降低幻觉以及内容挖掘方向的研究,对于提升智能体的性能和用户体验具有重要的现实意义。 课题方向: 1、多模态交互方向:深入研究语音、图像、文本等多模态信息的融合与交互技术,使智能体能够准确理解不同模态输入的含义,并根据用户需求以不同模态进行输出,实现自然流畅的交互体验; 2、深度思考方向:利用大模型的深度推理机制,提升智能体的逻辑推理、反思和问题解决能力。引入知识图谱等技术,增强智能体对知识的理解和运用能力,使其能够在面对复杂问题时,进行深度思考和分析,挖掘问题的本质,提供更具逻辑性和准确性的回答; 3、规划调度方向:构建智能工具调度系统,使智能体能够根据用户问题的类型和需求,自动识别并调用合适的内外部MCP工具,并自行设计工具调度的串并行顺序; 4、降低幻觉方向:大模型的幻觉会带来指令遵循能力差、回复生成质量低、执行流程错误等致命问题,严重影响用户对于智能体的信赖程度,需要被系统性地通过模型、架构、解决方案等多个层面去解决; 5、优质内容挖掘方向:研发高效的内容挖掘算法,从字节跳动站内外的海量的文本、图像、视频等数据中筛选出优质、有价值的信息。对内容进行分类、标注和评估,建立优质内容数据库。通过与智能体的交互,根据用户的兴趣和需求,定向挖掘优质内容,满足用户对高质量信息的获取需求。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:团队负责公司多个跨产品业务方向,提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据、舆情、众包标注、中间件等多类型的中台能力与技术解决方案,积极利用AI等技术做中台能力提效与升级。加入我们,你将有机会从中台的多视角参与业务建设,感受不同类型/阶段的业务特点;通过投身亿级用户场景的开发&架构工作,学习和解决极富挑战的技术问题;你也可以从数据出发,积极利用策略和模型,为业务提供有价值的助力。 1、研究、创新、开发和优化最先进的大模型算法和智能体技术,如大模型数据合成、大模型后训练技术、多模态大模型、自主规划智能体、检索增强等; 2、精益求精,结合最新的深度学习框架,如TensorFlow、PyTorch等,不断优化和改进现有的大模型和智能体技术,通过Data Driven的方法不断提高模型的准确性和性能,达到最优状态; 3、研究和开发大模型应用技术,并落地字节跳动各业务场景; 4、跟进前沿的大模型和智能体技术,保持技术的领先。
团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题介绍: 背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。 研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、信息检索:开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 5、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 6、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 7、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。