logo of xiaohongshu

小红书【2027届】大模型推理研发实习生-创作发布

实习兼职引擎地点:北京 | 上海 | 广州状态:招聘

任职要求


职位要求
1、本科及以上学历在读,计算机相关专业优先;
2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言;
3、了解Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。
团队介绍:创作发布团队负责小红书“+”号入口,是全平台用户笔记发布的核心能力模块,承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术,持续提升内容创作效率与用户体验。
在这里,AI 引擎工程师将聚焦于结合小红书内部业务特点,对“端 & 云 AI 推理引擎”进行深度优化,从模型能力构建、框架适配,到端云协同部署,推动算法真正落地业务,构建完整的推理闭环。
你将接触并支持的算法方向包括:AIGC、文本与多模态大语言模型(LLM)、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高,对底层推理性能提出了极高挑战。

1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理;
2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度,KVCache-centric调度,实现动态、及时、准确的扩缩容管理;
3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度,充分发挥大规模分布式集群算力;
4、参与大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复;
5、参与多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布。
包括英文材料
学历+
Linux+
C+++
Go+
Python+
Bash+
Kubernetes+
还有更多 •••
相关职位

logo of bytedance
实习A245001A

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok Shop是以TikTok为载体的内容电商业务,致力于成为用户发现并获取优价好物的首选平台,在直播电商、视频内容电商等多场景下,TikTok Shop希望能为用户提供更个性化、更主动、更高效的消费体验,为商家提供稳定可靠的平台服务,在更多的地区实现没有难卖的优价好物,让美好生活触手可得的使命。我们邀请你来此成长、钻研,发掘无限的潜力,一起应对技术和业务上的挑战。目前团队拥有丰富的国际产品研发经验,包容多元的文化,且在全球设立研发团队,邀请你来一起接受跨国合作的挑战,还有出差外派机会在等你! 1、负责大模型、AIGC服务链路和应用平台的开发,支撑相关业务的生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、负责大规模样本数据的管理、标注、预处理、存储等能力建设,提供训练和推理使用的基础设施保障; 4、构建适合电商场景的AI应用Workflow编排框架和平台,方便电商各业务搭建AI应用链路; 5、负责电商GPU资源管理和优化调度,并建设管理工具平台,优化GPU管理效率,提升资源池整体利用率; 6、探索业界前沿的深度学习相关技术,持续提升平台能力、降低研发与算法的使用成本。

更新于 2026-01-04上海
logo of siemens
实习研发

N/A

更新于 2025-12-09北京
logo of bytedance
实习A253623

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05上海
logo of bytedance
实习A19983

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05北京