阿里云研究型实习生 - 面向生产级别的多模态RAG实现的效果优化
任职要求
● 计算机及相关专业的博士或硕士,具备自然语言处理(NLP)或机器学习(ML)等领域的研究背景。 ● 对大语言模型前沿技术有深入研究,并在相关顶级会议或期刊上发表过文章。 ● 在大模型领域有实际工作经验,曾参与过RAG和Agent等相关产品的研发。 ● 具备优秀的编程和分析解决问题的能力,能够产出高水平的论文和专利等学术成果。 ● 实习时间六个月及以上。
工作职责
RAG(检索增强生成)是一种将信息检索技术与大语言模型相结合的技术架构。它通过从海量文档中检索出与查询相关的信息,并将这些信息输入到大语言模型中,从而生成更准确且全面的回答或文本。然而,要实现生产级的RAG性能和可靠性,还需要面临诸多挑战。阿里云人工智能平台(PAI)团队专注于RAG平台的开发与持续优化,致力于推动企业级RAG在实际业务中的落地与应用。我们目前的研究和开发方向包括但不限于: 1. 查询理解与优化:提升对大语言模型的查询理解能力,优化召回机制及查询重排序算法。 2. 多模态的文档理解和问答生成:提升多模态文档(包括文本和图像等)的理解及问答生成能力。 3. 大模型Agent技术:提升基于大语言模型的Agent的任务规划和工具调用能力。 4. Text2SQL生成:优化从自然语言自动生成SQL查询的准确性。 5. RAG效果评估:构建benchmark和效果评估。
我们致力于优化云计算场景下的弹性计算服务(ECS)资源调度系统,通过算法创新解决动态资源分配、集群资源优化等核心问题。本岗位将深度参与资源调度算法的设计与实现,推动资源装箱效率提升、性能争用降低等关键技术突破,最终实现资源供给成本优化与整体资源利用率的显著提升。具体职责包括: 1. 研究并设计面向云计算场景的资源调度算法,解决海量算力需求下的资源分配效率问题; 2. 结合服务等级协议(SLA)要求,优化调度系统在成本、稳定性、性能等多目标约束下的决策机制; 3. 分析集群资源使用数据,建设资源画像,提出并实施资源利用率提升方案; 4. 实现算法原型,推动算法在实际生产环境中的落地与迭代; 5. 跟踪前沿技术动态,探索机器学习、强化学习等技术在资源调度领域的创新应用。
随着人工智能技术的飞速发展,AI 大模型对计算资源的需求日益增长。数据中心作为支撑 AI 运算的基础设施,其网络性能和稳定性直接影响 AI 模型训练的效率和推理准确性。然而,当前的数据中心网络在处理大规模数据传输、高并发请求以及复杂网络拓扑时仍然面临诸多挑战。为此,开发新一代数据中心网络技术意在提升网络传输速度、降低延迟、增强网络的容错以及故障定位等能力,对于推动 AI 技术的进一步发展具有重要意义。本项目意在聚焦于阿里云面向 AI 大模型训练的网络性能和稳定性优化技术,具体解决如下几个关键问题: 1、关于 AI 训练网络中故障的快速响应和定位问题,如何通过建立集合通信 log、上层训练框架代码 log 以及底层网络拓扑信息进行横向关联后进行精准、高校的故障根因定位; 2、AI 大模型训练要求网络能够针对故障快速恢复,恢复过程要保证新设备的热迁移,以及如何选择被迁移设备,保证客户侧无感知 3、关于下一代集合通信以及网卡侧的传输协议设计,针对性的对大模型训练和推理特征设计一套行之有效的优化技术,针对其周期性、突发式带宽的传输协议解决关键的技术挑战 交付指标: 1、发表 1-2 篇国际顶级会议论文(如 SIGCOMM/NSDI/OSDI/SOSP) 2、专利 1-2 发明专利 3、能够实际在阿里云生产环境运行的系统(非原型系统),产生实际的结果收益
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。