小红书【2027届】大模型推理研发实习生-创作发布

实习兼职引擎2025-10-22地点：北京 | 上海 | 广州状态：招聘

扫码手机上打开

任职要求

职位要求
1、本科及以上学历在读，计算机相关专业优先；
2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言；
3、了解Kubernetes架构和生态，熟悉Docker/Containerd/Kata/Podman等容器技术；
4、有优秀的逻辑分析能力，能够对业务逻辑进行合理的抽象和拆分；
5、有强烈的工作责任心，较好的学习能力、沟通能力和自驱力，能够快…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

日常实习：面向全体在校生，为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。
团队介绍：创作发布团队负责小红书“+”号入口，是全平台用户笔记发布的核心能力模块，承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术，持续提升内容创作效率与用户体验。
在这里，AI 引擎工程师将聚焦于结合小红书内部业务特点，对“端 & 云 AI 推理引擎”进行深度优化，从模型能力构建、框架适配，到端云协同部署，推动算法真正落地业务，构建完整的推理闭环。
你将接触并支持的算法方向包括：AIGC、文本与多模态大语言模型（LLM）、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高，对底层推理性能提出了极高挑战。

1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理；
2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度，KVCache-centric调度，实现动态、及时、准确的扩缩容管理；
3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度，充分发挥大规模分布式集群算力；
4、参与大模型服务的稳定性，通过线上和线下的多系统联动，实现在多种异构资源（GPU、CPU、其他异构硬件）、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复；
5、参与多机房、多地域、多云场景的在离线任务/服务调度，实现负载的合理化分布。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Linux+

C+++

Go+

Python+

Bash+

Kubernetes+

还有更多 •••

登录查看完整学习资料

相关职位

移动研发实习生-App Infra

实习A204304

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：App Infra是字节跳动面向应用的基建中台部门，以App侧性能/稳定性深度优化为基础，结合LLM、Agent、生成式推荐模型等前沿技术，为字节跳动旗下的核心应用提供终端+平台的解决方案。于下层，结合操作系统、虚拟机、工具链、编译器等技术，建设了稳定性、流畅性、电量在内全链路的监控体系和调试分析工具；于上层，则结合端侧特征工程、深度学习模型/决策树模型/SLM训练等基建，围绕搜索/推荐/广告/直播/电商等场景，建设了云端协同推荐、品质体验优化等端智能解决方案。如果你热爱挑战底层技术、追求极致优化，又渴望把AI转化为千万用户感受得到的流畅与智能——欢迎加入，和我们一起打造下一代移动体验！ 1、主导端侧AI基建与架构设计，深度参与框架选型、技术路线决策，与算法团队共建高可用、高性能的端智能体系； 2、负责SLM、VLM、端侧大模型的工程化落地，攻克轻量化部署、低延迟推理、资源受限场景下的实时智能难题； 3、面向Android、iOS、鸿蒙多平台做深度适配，解决端侧算力、功耗、内存、稳定性等硬核工程问题； 4、结合LLM/Agent最新演进方向，迭代工具链与部署方案，持续提升端云协同智能的效率与体验。

更新于 2026-01-08北京

【转正实习】算法工程师-大模型

实习蚂蚁集团2027

1.负责以大模型为代表的AI技术能力的建设和优化，打造业界领先的AI技术系统，主要职责包括AI系统结构设计、RAG 系统开发、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化等； 2.紧密跟踪、探索大模型方向前沿技术，依托丰富且体系化的业务生态，实践大模型算法的创新应用与落地。

北京|上海|杭州

【转正实习】算法工程师-智能体

实习蚂蚁集团2027

1. Agent核心算法研发：负责AI智能体（Agent）核心算法的设计与实现，包括任务规划、记忆管理、工具调用等模块，并探索强化学习（RL）在其中的应用。 2. 模型优化与对齐：应用SFT、RLHF等对齐技术，负责模型输出的逻辑校验与“幻觉”缓解，提升Agent决策的准确性与可靠性。 3. 性能与推理优化：研究并应用量化、并行计算等技术，优化大模型推理效率，提升Agent的响应速度与运行性能。 4. 框架开发与原型验证：参与Agent框架的开发、测试与迭代，并快速将前沿算法思想转化为可交互的产品原型。 5. 大模型和产品结合：创建产品和模型训练之间的数据飞轮，构建产学研的轮转迭代。 6. 基于执行反馈的学习算法研发：使AI系统能够从实践中学习并生成更有效的训练算法，深入理解奖励函数设计、探索-利用平衡以及如何避免多样性崩溃等关键问题。

北京|上海|杭州

算法实习生-搜索

实习A210779

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、红果短剧、番茄小说、AI搜索等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习\大模型技术进行端到端建模并不断创新突破，同时专注于分布式系统、机器学习系统的构建和性能优化，从内存、Disk等优化到索引压缩、召回、排序等算法的探索，致力于支撑字节跳动持续多元化的产品创新和高速的业务增长、基于大模型革新和重塑下一代搜索技术体系，充分给同学们提供成长自我的机会。主要工作方向包括： 1、探索前沿的NLP技术：全面基于LLM的Query分析、相关性、个性化预估、满意度评估、生成式检索等，全链路应用LLM/VLM，每个细节都充满挑战； 2、跨模态匹配技术：进行多模态预训练，在超大规模的多模态表征、匹配、生成等多个技术方向上持续突破，打造世界领先的多模态搜索系统； 3、大规模流式机器学习技术：应用大规模机器学习，解决搜索中的推荐问题，让搜索更加个性化更加懂你； 4、千亿级数据规模的架构：从大规模离线计算，分布式系统的性能、调度优化，到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新； 5、推荐技术：基于超大规模机器学习、Causal Inference、大模型推理等技术手段，构建业界领先的搜索推荐系统，对搜索推荐技术进行探索和创新。

更新于 2026-04-14北京