小红书AI推理工程实习生
实习兼职后端开发地点:北京状态:招聘
任职要求
- 优秀的代码能力,扎实的数据结构和基础算法功底; - 熟悉至少一种主流的机器学习框架(Tenso…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与对深度学习模型进行模型剪枝、蒸馏、量化等相关压缩技术的研究与落地; 2. 参与研发深度学习模型推理服务框架,实现推理服务高吞吐、低延迟、高可用; 3. 参与不同NPU/GPU上高性能训练/推理算子研发,实现训练/推理计算加速。
包括英文材料
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
还有更多 •••
相关职位
实习引擎
核心职责 参与小红书万亿级Token量推理系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型推理系统; 探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益; 探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统; 参与MaaS系统的国产卡适配,如华为910C、阿里PPU等; 参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。
更新于 2025-11-25北京|上海
实习引擎
1、建设小红书推荐、搜索和电商领域算法团队相关的算法工程能力 2、支持大规模算法服务的设计、开发和编排调度,满足在线审核、内容理解等业务需求 3、支持基于LLM的AI能力在小红书问答、客服等多个场景落地
更新于 2025-09-12北京|上海
实习
1. 负责AI推理框架的调研、分析和测试,输出方案选型报告 2. 负责视觉、音频、影像等AI模型在推理框架上的部署 3. 负责AI推理框架中各个算子性能/兼容性等问题并解决
更新于 2025-08-28深圳