logo of xiaohongshu

小红书【Ace顶尖实习生】多模态大模型驱动的端工程架构设计、改造的研究

实习兼职客户端开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、不限年级,本科及以上在读,人工智能/计算机/软件工程等相关专业优先;
2、具备优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++Python等一个或多个编程语言;
3、熟悉大模型相关的算法和技术,有自然语言处理大模型训练、强化学习算法经验者优先;
4、在软件工程或者人工智能领域有出色的科研经历,在NeurlPS/ICRL/ICML/ISSTA/ACL/EMNLP等国际顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。

工作职责


深入研究和应用AI大模型技术,对工程架构做全面设计,推动架构智能化升级,确保系统具备高扩展性、高稳定性和高性能,以适应不断变化的业务需求和数据量的增长。
包括英文材料
数据结构+
算法+
C+
C+++
Python+
大模型+
NLP+
强化学习+
ICML+
相关职位

logo of xiaohongshu
实习大模型

本课题的研究目标是: 1、研究如何充分用好文本、图片、视频等各个模态的有效信息,进行高效的多模态数据表征和联合建模,能够更加高效的从各个模态中学习有效信息; 2、探索多模数据如何才能更高效的学习,多模数据如何对文本智能能力有提升,探索理解和生成的联合建模如何进一步提高多模态模型的能力上限。

更新于 2025-08-22
logo of xiaohongshu
实习基础后端

本课题聚焦在多模态数据场景下如何高效的组织其向量索引数据,设计并实现配套的混合查询优化技术,能根据用户请求动态选择合理的索引组合,实现耗时、吞吐的合理平衡。 预期成果是能用单一向量数据库产品原生支持异构多模态数据的向量索引构建和混合查询,为多模态大模型场景提供高效的向量支持。

更新于 2025-07-19
logo of xiaohongshu
实习大模型

尽管当前的多模态大模型(融合视觉、语音、文本)已展现出强大的感知与理解潜力,但是在实时交互场景中,由于模型设计导致的高延迟、生硬的轮次状态、频繁的打断或被打断严重影响信息传递效率。同时多个模态无法实时融合也限制了多模态模型在语音交互场景下的深度应用。生成的交互内容有时显得冗长、缺乏提炼或智能不足,这些问题限制了用户与大模型实时交流的体验。 本课题的目标是设计并验证一种全模态实时交互的大模型架构,将视觉模态、语音流模态、思考模态信息以及 SOTA LLM 进行实时融合。从而使得大模型可以与人进行即时、流畅、且深入浅出、富有智慧的多模态自然语音对话。

更新于 2025-09-06
logo of xiaohongshu
实习引擎

本课题研究如何优化向量检索技术以增强大型语言模型能力。 主要方向包括: 1、优化高维向量索引结构,实现千亿级多模态数据的高效检索; 2、设计多Agent场景下的智能检索增强生成(Agentic RAG)策略,探索检索结果与大模型上下文的最优融合方法; 3、研究基于向量检索优化大模型推理过程中的KV Cache机制,为智能体应用的效果优化和大模型推理提供关键技术支持。