小红书【Ace顶尖实习生】多模态大模型驱动的端工程架构设计、改造的研究

实习兼职客户端开发地点：北京 | 上海 | 杭州状态：招聘

扫码手机上打开

任职要求

1、不限年级，本科及以上在读，人工智能/计算机/软件工程等相关专业优先；
2、具备优秀的代码能力、数据结构和基础算法功底，熟练掌握C/C++、Python等一个或多个编程语言；
3、熟悉大模型相关的算法和技术，有自然语言处理、大模型训练、强化学习算法…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

深入研究和应用AI大模型技术，对工程架构做全面设计，推动架构智能化升级，确保系统具备高扩展性、高稳定性和高性能，以适应不断变化的业务需求和数据量的增长。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

数据结构+

算法+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

Hi Lab-【Ace顶尖实习生】探索多模态大模型的通用能力增强和跨模态能力迁移

实习大模型

本课题的研究目标是： 1、研究如何充分用好文本、图片、视频等各个模态的有效信息，进行高效的多模态数据表征和联合建模，能够更加高效的从各个模态中学习有效信息； 2、探索多模数据如何才能更高效的学习，多模数据如何对文本智能能力有提升，探索理解和生成的联合建模如何进一步提高多模态模型的能力上限。

更新于 2025-08-22北京|上海|杭州

【Ace顶尖实习生】面向多模态数据的向量索引组织与混合查询优化技术研究

校招基础后端

本课题聚焦在多模态数据场景下如何高效的组织其向量索引数据，设计并实现配套的混合查询优化技术，能根据用户请求动态选择合理的索引组合，实现耗时、吞吐的合理平衡。预期成果是能用单一向量数据库产品原生支持异构多模态数据的向量索引构建和混合查询，为多模态大模型场景提供高效的向量支持。

更新于 2025-11-21上海|杭州|北京

Hi Lab-【Ace顶尖实习生】全模态实时交互大模型研究（语音方向）

实习大模型

尽管当前的多模态大模型（融合视觉、语音、文本）已展现出强大的感知与理解潜力，但是在实时交互场景中，由于模型设计导致的高延迟、生硬的轮次状态、频繁的打断或被打断严重影响信息传递效率。同时多个模态无法实时融合也限制了多模态模型在语音交互场景下的深度应用。生成的交互内容有时显得冗长、缺乏提炼或智能不足，这些问题限制了用户与大模型实时交流的体验。本课题的目标是设计并验证一种全模态实时交互的大模型架构，将视觉模态、语音流模态、思考模态信息以及 SOTA LLM 进行实时融合。从而使得大模型可以与人进行即时、流畅、且深入浅出、富有智慧的多模态自然语音对话。

更新于 2025-09-06上海|北京|杭州

【Ace顶尖实习生】向量检索在大模型场景的应用和优化研究

实习引擎

本课题研究如何优化向量检索技术以增强大型语言模型能力。主要方向包括： 1、优化高维向量索引结构，实现千亿级多模态数据的高效检索； 2、设计多Agent场景下的智能检索增强生成(Agentic RAG)策略，探索检索结果与大模型上下文的最优融合方法； 3、研究基于向量检索优化大模型推理过程中的KV Cache机制，为智能体应用的效果优化和大模型推理提供关键技术支持。

上海|杭州|北京