logo of xiaohongshu

小红书【2027届】大模型推理研发实习生-创作发布

实习兼职引擎地点:北京 | 上海 | 广州状态:招聘

任职要求


职位要求
1、本科及以上学历在读,计算机相关专业优先;
2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言;
3、了解Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。
团队介绍:创作发布团队负责小红书“+”号入口,是全平台用户笔记发布的核心能力模块,承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术,持续提升内容创作效率与用户体验。
在这里,AI 引擎工程师将聚焦于结合小红书内部业务特点,对“端 & 云 AI 推理引擎”进行深度优化,从模型能力构建、框架适配,到端云协同部署,推动算法真正落地业务,构建完整的推理闭环。
你将接触并支持的算法方向包括:AIGC、文本与多模态大语言模型(LLM)、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高,对底层推理性能提出了极高挑战。

1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理;
2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度,KVCache-centric调度,实现动态、及时、准确的扩缩容管理;
3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度,充分发挥大规模分布式集群算力;
4、参与大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复;
5、参与多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布。
包括英文材料
学历+
Linux+
C+++
Go+
Python+
Bash+
Kubernetes+
还有更多 •••
相关职位

logo of antgroup
实习蚂蚁集团2027

1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统,主要职责包括AI系统结构设计、RAG 系统开发、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型算法的创新应用与落地。

北京|上海|杭州
logo of antgroup
实习蚂蚁集团2027

1. Agent核心算法研发:负责AI智能体(Agent)核心算法的设计与实现,包括任务规划、记忆管理、工具调用等模块,并探索强化学习(RL)在其中的应用。 2. 模型优化与对齐:应用SFT、RLHF等对齐技术,负责模型输出的逻辑校验与“幻觉”缓解,提升Agent决策的准确性与可靠性。 3. 性能与推理优化:研究并应用量化、并行计算等技术,优化大模型推理效率,提升Agent的响应速度与运行性能。 4. 框架开发与原型验证:参与Agent框架的开发、测试与迭代,并快速将前沿算法思想转化为可交互的产品原型。 5. 大模型和产品结合:创建产品和模型训练之间的数据飞轮,构建产学研的轮转迭代。 6. 基于执行反馈的学习算法研发:使AI系统能够从实践中学习并生成更有效的训练算法,深入理解奖励函数设计、探索-利用平衡以及如何避免多样性崩溃等关键问题。

北京|上海|杭州
logo of bytedance
实习A81633A

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 2、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。

更新于 2026-03-17杭州
logo of bytedance
实习A37366

团队介绍:抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下,能够更好的给抖音用户带来更好的信息消费体验,也能够让抖音这个大型组织能够更加高效的运转,从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设,包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强,以发展成为AI Native组织为目标,努力拓展传统协作模式的职责边界,充分给同学们提供自身探索的空间。 课题介绍:抖音研发团队,负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发,以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向: 1、用户体验:抖音场景下的端侧大模型架构与推理加速体系研究; 2、抖音直播:迭代3D生成大模型,优化数据、编码和模型架构,提升3D资产生成效率和品质; 3、汽水音乐:聚焦音乐生成大模型的核心算法研究与优化,旨在攻克上述技术瓶颈,提升AI音乐创作的质量、可控性与创新性,赋能短视频配乐、虚拟偶像等多元应用场景; 4、AI技术研究与赋能:随着大模型在代码生成与软件开发中的应用不断深化,构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练(SFT/RL)、到推理部署的全链路优化,探索从需求理解,代码生成与修复,与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题,推动AI在抖音等真实业务研发场景中的规模化落地; 5、小荷健康:围绕问诊、工具调用、科普与病例分析,提升医疗大模型任务规划与推理能力,保证结果准确稳定可用。 课题挑战: 1、资源约束极强,需兼顾算力、内存与功耗;通用性要求高,需支撑多业务场景高精度处理;面向差异化设备,实现任务复杂度的弹性适配; 2、高质量3D数据严重稀缺,3D几何与纹理表征复杂,生成质量与美术水准比仍有差距,当前链路冗长效率偏低; 3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题; 4、抖音研发大模型需高效的业务知识注入,复杂且超长的上下文管理,解决高质量训练数据稀缺,Agentic RL的持续训练; 5、小荷健康围绕医疗场景基座模型 ,Agent Foundation构建与评测体系,强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略,兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联,实现医疗大模型能力与实际应用效果的协同提升。 课题价值: 1、技术价值:等参数量级下,可大规模落地的业界领先模型;业务价值:提升抖音用户和业务接入的覆盖面,获得用户和营收价值; 2、技术上提升3D表征与生成能力,迭代3D生成大模型;业务上支撑直播和社交应用,产出丰富3D资产,满足海量用户的个性化需求; 3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈,引领AI音乐生成技术前沿;业务上提升抖音/汽水音乐的AI创作能力,降低音乐创作门槛,丰富内容生态,提供音乐内容供给; 4、技术上探索前沿模型训练策略,构建字节内部真实环境下的数据飞轮,提高业务研发效率,提升代码质量与性能; 5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破,提升问诊、科普、病例分析等核心场景业务效果,沉淀可复用的数据、训练与评测方法,支撑长期模型演进。

更新于 2026-04-15北京