logo of alibaba

阿里巴巴大模型Multi-Agent算法实习生

实习兼职淘天集团日常实习生批次地点:北京 | 杭州状态:招聘

任职要求


1.计算机科学、人工智能、机器学习自然语言处理NLP)等相关领域的硕士或博士在校生;
2.熟练掌握至少一种开源Multi-Agent框架(例如LangGraph),具有良好的编程习惯;
3.熟悉多智能体系统,具有深度推理、Deep Research、Code Agent等相关算法经验优先;
4.具备较强的分析问题和解决问题的能力,逻辑思维清晰,拥有良好的自学能力;
5.拥有NeuripsICMLICLR、ACL、EMNLP等顶级会议经验者优先。

工作职责


1. 深入探索LLM在深度推理、深度研究(Deep Research)、Code Agent等领域的技术研究,推动AI技术在实际应用中的突破;
2. 立足Multi-Agent应用体系,优化Multi-Agent自动构建、Agent通信语言、Memory机制、Reflection机制等算法方案。
3. 探索工业级的Multi-Agent强化学习算法方案,提升Multi-Agent系统的执行效率和结果对齐准确度。在创新应用场景中,优化长上下文场景的推理算法架构,探索System2技术边界。
4. 与团队成员紧密合作,作为应用算法同学,完成论文产出,同时确保研究成果能够无缝集成到现有创新产品中。
包括英文材料
机器学习+
NLP+
Python+
编程规范+
RAG+
ICML+
AI agent+
算法+
NeurIPS+
智能体+
相关职位

logo of bytedance
实习A222718

团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题介绍: 背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。 研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、信息检索:开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 5、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 6、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 7、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。

更新于 2025-03-04
logo of xiaohongshu
实习大模型

拥抱LLM技术,深度改进智能内容生成技术,构建高效的违规样本生成系统和知识检索增强框架,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.设计和开发基于大模型Agent的违规内容生成系统,构建多样化、高质量的违规样本数据集,提升模型SFT/RFT的性能上限; 2.负责构建和维护检索增强生成(RAG)案例库,包括违规案例的结构化存储、语义检索、案例匹配等,提升审核决策的准确性和可解释性; 3.进行大模型内容生成前沿技术探索和研发,包含但不限于Prompt Engineering、Few-shot Learning、Chain-of-Thought、Multi-Agent协作等;

更新于 2025-10-21
logo of baidu
实习ACG

-负责落地多模态大模型在多模态理解场景中的应用,负责多模态理解与审核场景端到端效果优化与提升 -重点研究文本、图像相关的多模态大模型相关的技术,包括但不限于数据建设、指令微调、模型优化、模型蒸馏等,提升数据构建合成、模型推理等能力 -构建大小模型融合的多模态推理系统,提升模型在理解与审核场景中的效果 -持续探索跟进学术与业界前沿进展,探索包括但不限于多模态CoT、多模态RAG、强化学习微调等能力并落地

更新于 2025-09-22
logo of bytedance
实习A233163

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动剪映研发团队,主要支持剪映、醒图、Faceu 等多款国内外产品的研发工作,业务覆盖多元化影像创作场景,截止2021年6月,相关产品多次登顶国内外App Store 免费应用榜第一,并继续保持高速增长。加入我们,一起打造全球最受用户欢迎的影像创作产品。 1、负责研发提效场景所需要的大模型能力的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等,不断思考和跟进AI的最新进展对我们的价值,探索下一代的研发模式; 2、高质量数据挖掘清洗使用,数据自动、半自动合成方案研究探索,设计针对代码场景的原子任务、全链路任务的评测方法; 3、研究LLM/VLM训练与优化技术,包括微调、强化学习(RLHF)、知识蒸馏等,提高大模型在代码场景下的能力; 4、尝试落地到各种应用场景,比如:IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等; 5、持续跟踪LLM/VLM领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地。

更新于 2025-09-08