logo of bytedance

字节跳动AI Agent研发实习生-智能创作

实习兼职A07601A地点:北京状态:招聘

任职要求


1、2026届硕士及以上学位在读,计算机、软件工程等相关专业优先;
2、动手能力强,精通PythonJavaC++Go其中一种或多种编程语言,具备良好的软件框架和应用设计能力;深入理解主流机器学习框架,如PyTorchTensorFlow,对Transformer架构有深入理解,熟练掌握Lora训练加分;
3、深入了解AI Agents技术栈,掌握LangChain/Llamaindex等LLM开发工具框架,有丰富的智能体开发和Prompt Engineering调优经验,Multi-Agent Systems项目经验者优先;
4、熟练使用各种开源或SaaS版的Agent开发平台,熟练掌握LLM应用程序的部署和运维,熟悉REST API接口开发,并具备微服务部署经验;
5、熟悉NLP、ML和模型微调者优先,有LLMOps应用和开发经验者优先,理解强化学习(Reinforcement Learning)、提示工程(Prompt Engineering)等技术在智能代理中的应用;
6、在计算机视觉/NLP顶会或期刊上发表过论文者优先;在计算机视觉/NLP知名竞赛取得优异名次者优先;有高质量Github项目经验者优先。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。

1、设计和实现基于LLM的智能体架构,包括任务规划、对话管理、意图识别、流程工程等;
2、设计和实现多模态Agent,支持文本、语音、图像等多种输入/输出形式的处理;
3、推动AI Agent在架构和性能上的持续优化,提升Agent对用户理解能力和响应的准确性;
4、开发和维护智能体的后端服务,确保系统的稳定性和可扩展性;
5、跟踪并研究行业前沿AI算法,持续提升AI Agent的技术水平;
6、编写必要的技术文档,包括API接口说明、核心算法设计与代码开发。
包括英文材料
学历+
Python+
Java+
C+++
Go+
机器学习+
PyTorch+
TensorFlow+
Transformer+
AI agent+
LangChain+
大模型+
Prompt+
SaaS+
REST+
微服务+
NLP+
强化学习+
OpenCV+
相关职位

logo of bytedance
实习A52415

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 课题介绍: 背景: 视频创作是内容平台生态的最关键环节。随着AGI大模型技术的发展,行业内AI视频创作Workflow不断革新,传统的视频剪辑工具面临严峻行业挑战。AI Native视频创作大模型技术,旨在研发一套基于大模型的视频创作系统,来改善用户创作过程中灵感匮乏、创作提质提效及降低门槛使人人都是优质创作者等难点问题。应用上,可落地支持抖音、剪映Capcut、Flow等业务的图片与视频创作工具,形成公司关键业务场景的核心生态壁垒。 课题挑战: 1、中长视频多模态理解能力:创作场景需要对用户素材充分理解,因此大模型需要对输入视频的画面、声音及语音等能充分理解,具备素材剪辑处理的通用理解能力; 2、创作领域专业Agent能力: 大模型需要具备创作领域AGI的潜力,对于营销、UGC、PGC等不同创作场景,模型需要具备优质视频创作知识储备,能基于原子能力Tools规划合理的Action Sequence完成创作; 3、多模态输出能力:在视频创作领域,需要进行视频效果包装,因此模型需要具备输出音效/声音/文字贴纸/转场特效等能力; 4、高效率模型推理:由于输入视频时长较长,任务复杂,考虑应用落地成本,模型在处理长Context的推理效率与实际效果的Trade-off依赖技术突破。

更新于 2025-02-28
logo of bytedance
实习A108475A

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 课题介绍: 背景: 视频创作是内容平台生态的最关键环节。随着AGI大模型技术的发展,行业内AI视频创作Workflow不断革新,传统的视频剪辑工具面临严峻行业挑战。AI Native视频创作大模型技术,旨在研发一套基于大模型的视频创作系统,来改善用户创作过程中灵感匮乏、创作提质提效及降低门槛使人人都是优质创作者等难点问题。应用上,可落地支持抖音、剪映Capcut、Flow等业务的图片与视频创作工具,形成公司关键业务场景的核心生态壁垒。 课题挑战: 1、中长视频多模态理解能力:创作场景需要对用户素材充分理解,因此大模型需要对输入视频的画面、声音及语音等能充分理解,具备素材剪辑处理的通用理解能力; 2、创作领域专业Agent能力: 大模型需要具备创作领域AGI的潜力,对于营销、UGC、PGC等不同创作场景,模型需要具备优质视频创作知识储备,能基于原子能力Tools规划合理的Action Sequence完成创作; 3、多模态输出能力:在视频创作领域,需要进行视频效果包装,因此模型需要具备输出音效/声音/文字贴纸/转场特效等能力; 4、高效率模型推理:由于输入视频时长较长,任务复杂,考虑应用落地成本,模型在处理长Context的推理效率与实际效果的Trade-off依赖技术突破。

更新于 2025-02-26
logo of bytedance
实习A123836B

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 课题介绍: 背景: 视频创作是内容平台生态的最关键环节。随着AGI大模型技术的发展,行业内AI视频创作Workflow不断革新,传统的视频剪辑工具面临严峻行业挑战。AI Native视频创作大模型技术,旨在研发一套基于大模型的视频创作系统,来改善用户创作过程中灵感匮乏、创作提质提效及降低门槛使人人都是优质创作者等难点问题。应用上,可落地支持抖音、剪映Capcut、Flow等业务的图片与视频创作工具,形成公司关键业务场景的核心生态壁垒。 课题挑战: 1、中长视频多模态理解能力:创作场景需要对用户素材充分理解,因此大模型需要对输入视频的画面、声音及语音等能充分理解,具备素材剪辑处理的通用理解能力; 2、创作领域专业Agent能力:大模型需要具备创作领域AGI的潜力,对于营销、UGC、PGC等不同创作场景,模型需要具备优质视频创作知识储备,能基于原子能力Tools规划合理的Action Sequence完成创作; 3、多模态输出能力:在视频创作领域,需要进行视频效果包装,因此模型需要具备输出音效/声音/文字贴纸/转场特效等能力; 4、高效率模型推理:由于输入视频时长较长,任务复杂,考虑应用落地成本,模型在处理长Context的推理效率与实际效果的Trade-off依赖技术突破。

更新于 2025-03-12
logo of alibaba
实习淘天集团2026

1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破复杂推理、数据洞察、AI搜索、文案创作、图像连续编辑等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。

更新于 2025-05-07