logo of xiaohongshu

小红书【2027届】大模型推理研发实习生-创作发布

实习兼职引擎地点:北京 | 上海 | 广州状态:招聘

任职要求


职位要求
1、本科及以上学历在读,计算机相关专业优先;
2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言;
3、了解Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。
团队介绍:创作发布团队负责小红书“+”号入口,是全平台用户笔记发布的核心能力模块,承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术,持续提升内容创作效率与用户体验。
在这里,AI 引擎工程师将聚焦于结合小红书内部业务特点,对“端 & 云 AI 推理引擎”进行深度优化,从模型能力构建、框架适配,到端云协同部署,推动算法真正落地业务,构建完整的推理闭环。
你将接触并支持的算法方向包括:AIGC、文本与多模态大语言模型(LLM)、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高,对底层推理性能提出了极高挑战。

1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理;
2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度,KVCache-centric调度,实现动态、及时、准确的扩缩容管理;
3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度,充分发挥大规模分布式集群算力;
4、参与大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复;
5、参与多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布。
包括英文材料
学历+
Linux+
C+++
Go+
Python+
Bash+
Kubernetes+
还有更多 •••
相关职位

logo of bytedance
实习A66915

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音电商算法团队,依托抖音、今日头条、番茄小说、红果短剧等产品,帮助用户发现、讨论并获得好物,享受美好生活;帮助商家高效经营,创建良性商业生态;激励创作并分享购物经验使用心得,构建有真诚有信息的电商内容氛围。在这个团队,我们不仅要通过推荐、广告和搜索算法搭建消费者和商家之间的桥梁,也要通过风控算法和治理算法去甄别违规行为,保护用户的购物体验,保护真正诚信经营的商家;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率,降低商家的经营成本;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户物流体验;另外我们还会用业界先进的数据科学技术为业务健康发展保驾护航。我们的使命:用算法的能力,让用户总能发现好东西,让美好生活触手可得。 1、深入理解抖音电商正向导购与逆向治理业务,基于大模型、多模态技术,优化商家/达人准入、发品、导购等全场景识别效果,同步探索语言、视频、推荐多模态融合方案,构建更强推荐系统; 2、迭代优化电商多模态大模型,强化其对治理规则、商品信息的理解与推理反思能力,通过业务域SFT、Cot、强化学习等技术,打造高准高召的识别能力,提升导购与治理审核智能化水平; 3、参与挖掘电商直播、短视频、图文等多类实体数据,对大规模网络及海量特征序列建模,支撑商家/商品分类、逆向标签挖掘等场景,助力精准识别潜在购物信号; 4、研究用户多模态交互(视频+直播+文字+行为)的复杂性,搭建统一框架实现内容理解与用户意图推理,高效映射内容消费到电商兴趣,提升人货匹配效率; 5、参与构建大规模图存储与图学习平台,完善商家、商品、达人、内容的关系链路,打造电商实体通用表征能力,赋能多模态业务落地; 6、协助推进电商比价、供给生态等战略支持工作,运用前沿深度学习算法,搭建商家/达人成长预测模型,支撑冷启动、潜爆、智能营销等业务需求。

更新于 2026-01-20杭州
logo of bytedance
实习A246011A

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、多模态大模型Post-Training全链路优化:参与SFT、RL、Agent训练等核心算法的调优与创新,围绕搜索、教育、医疗等业务场景进行定向能力打磨,提升模型在真实任务中的效果与稳定性; 2、视频通话AI体验与多模态融合:参与视频通话基础AI能力的优化,包括视觉理解、长多轮对话、逻辑推理、联网搜索等;同时参与创新特性研发,如视频Memory、智能主动响应、音视频双工等,并推动多模态推理、智能体等技术在产品中的落地; 3、可穿戴硬件端AI能力与端云协同:协同优化端侧执行链路与服务端多模态模型的适配效果,打通端云协同流程,提升视频通话及硬件联动场景下的端到端体验; 4、手机助手基础体验与智能特性研发:参与手机助手的视觉理解、工具调用、跨应用任务规划等基础能力优化;同时参与手机Memory、GUI Agent、Intent理解等新特性的研究与落地,提升整体交互体验。

更新于 2026-01-26北京
logo of bytedance
实习A125182

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下,能够更好的给抖音用户带来更好的信息消费体验,也能够让抖音这个大型组织能够更加高效的运转,从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设,包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强,以发展成为AI Native组织为目标,努力拓展传统协作模式的职责边界,充分给同学们提供自身探索的空间。 1、负责代码大模型相关的数据收集、清洗、构建与管理,搭建高效稳定的数据处理Pipeline; 2、负责代码大模型评测体系的建设,包括评测集构建、评测框架开发与评测执行; 3、探索和实现基于大模型的智能体(Agent),应用于代码生成、Bug修复、测试用例生成等复杂研发任务; 4、持续追踪并复现LLM+SE领域前沿技术动态,并将其应用于实际业务场景中,推动技术落地。

更新于 2026-02-03北京
logo of bytedance
实习A151806B

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:商业化信任与安全研发团队致力于构建业界领先的智能审核系统,通过前沿 AI 技术保障商业内容安全与合规,提升用户客户的信任。团队通过研发大模型基座、先进的审核大模型和审核系统,持续提升大模型系统对复杂商业化内容的理解、让准确理解遵循安全规则、基于规则深度推理并拉齐人与机器之间的认知,并能感知发现潜在问题,并用Agent高效处理审核问题、自动迭代审核系统,为商业内容安全提供全链路、智能化的技术支撑。 1、搭建风险感知、风险研判、审核策略优化等智能体能力,支持交互类智能体训练; 2、参与审核链路的完全自主进化体系构建; 3、跟踪Agent前沿技术并进行可行性验证(如Perference-based RL、多智能体协作、DeepResearch、数据和模型的Scaling、轻量化模型新RL范式),支持数据基建和模Infra的基建工作,并在商业化安全场景中验证落地。

更新于 2026-01-26北京