字节跳动Agentic系统研发实习生-Data AML
任职要求
1、本科及以上学历在读,计算机相关专业优先; 2、熟练掌握Python/Java/Go等至少一门语言,有项目开发经验者优先; 3、对大模型有深入理解,熟悉LLM技术原理与应用方法,有Agent系统设计与实现经验;了解Memory机制、RAG、工具调用、规…
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责火山引擎-方舟大模型平台的Agent技术研发,包括Multi-Agent框架、Memory机制、Agent-RL等基础能力建设; 2、开发UI-Agent、DeepResearch Agent等专业领域Agent,提升大模型在特定场景的应用能力; 3、设计并实现易用高效的Agent开发套件,降低开发者使用Agent技术的门槛; 4、探索Agent方向的创新方法与技术,提出更先进的Agent范式,引领行业技术发展; 5、探索面向Agent的评估方法,构建火山方舟Agent评估体系。
【课题说明】 Agentic Search是以大模型为核心,具备自主感知、推理与行动能力的搜索新范式。它通过理解用户复杂意图,动态规划搜索路径,主动调用多种工具和数据源,持续优化结果推荐与交互体验。本课题旨在研究和构建面向美团App本地生活服务的Agentic Search系统,探索其在多轮对话、复杂任务分解、实时信息整合等场景下的关键技术与应用价值,推动本地生活智能搜索技术的创新升级。 【建议研究方向】 1.意图理解与任务分解:探索大模型在复杂用户需求下的多意图识别、任务分解、子任务规划能力,提升系统对复合型检索场景的适应性和响应能力。 2.多轮工具调用技术研究:赋予LLM长链路的多轮工具调用能力,打造基于强化学习等前沿技术的LLM后训练方案,提升多轮调用时的精确性及用户的实际交互体验。 3.增量学习训练技术探索:针对本地生活场景中数据不断更新的特点,运用增量学习技术,使 AI 搜索模型能够快速适应新数据。 搜索结果可解释性提升:探索基于大模型内容深度理解与推理的可解释理由生成,增强用户对搜索结果的信任感和透明度。
1、参与智能分析方向的产品和技术的系统研发、效果调优工作; 2、后端参与Prompt工程系统的设计开发,包括Agent,Prompt,Chain等核心模块; 3、参与团队工程化、组件化、可视化等系统的设计开发; 4、跟进业界技术动态,完成AI-Agent方向的技术调研、选型与落地。
1. 参与大模型检索增强生成(RAG)技术的研发与优化,包括但不限于: 1.1 文档检索算法(如稠密检索、混合检索)的改进与实现; 1.2 大模型与检索系统的协同优化; 1.3 端侧RAG,agentic RAG等技术路径探索。 2. 构建和评测RAG系统在垂直业务领域的应用效果,设计实验方案并分析结果。 3. 跟进学术界与工业界最新进展,复现论文或开源项目,参与RAG在小米落地应用的相关工作。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动用户增长(User Growth)负责抖音、今日头条、番茄小说、剪映等多个产品的用户增长业务,建立行业领先的增长和营销技术,打造极致的用户体验。加入我们,有机会参与亿级用户场景的开发与架构工作,也有机会从数据出发,利用策略和模型为业务带来更大的助力。 1、协助团队探索和实现抖音垂直业务场景的代码自动生成; 2、参与基于公司内部和外部开源模型的项目,帮助提升代码模型的准确性和效率; 3、学习并跟踪大型语言模型(LLM)的前沿技术,协助应用于研发效率提升的任务中。