小红书【2027届】大模型推理研发实习生-创作发布
任职要求
职位要求 1、本科及以上学历在读,计算机相关专业优先; 2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言; 3、了解Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术; 4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分; 5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快…
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。 团队介绍:创作发布团队负责小红书“+”号入口,是全平台用户笔记发布的核心能力模块,承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术,持续提升内容创作效率与用户体验。 在这里,AI 引擎工程师将聚焦于结合小红书内部业务特点,对“端 & 云 AI 推理引擎”进行深度优化,从模型能力构建、框架适配,到端云协同部署,推动算法真正落地业务,构建完整的推理闭环。 你将接触并支持的算法方向包括:AIGC、文本与多模态大语言模型(LLM)、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高,对底层推理性能提出了极高挑战。 1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理; 2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度,KVCache-centric调度,实现动态、及时、准确的扩缩容管理; 3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度,充分发挥大规模分布式集群算力; 4、参与大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复; 5、参与多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:App Infra是字节跳动面向应用的基建中台部门,以App侧性能/稳定性深度优化为基础,结合LLM、Agent、生成式推荐模型等前沿技术,为字节跳动旗下的核心应用提供终端+平台的解决方案。于下层,结合操作系统、虚拟机、工具链、编译器等技术,建设了稳定性、流畅性、电量在内全链路的监控体系和调试分析工具;于上层,则结合端侧特征工程、深度学习模型/决策树模型/SLM训练等基建,围绕搜索/推荐/广告/直播/电商等场景,建设了云端协同推荐、品质体验优化等端智能解决方案。如果你热爱挑战底层技术、追求极致优化,又渴望把AI转化为千万用户感受得到的流畅与智能——欢迎加入,和我们一起打造下一代移动体验! 1、主导端侧AI基建与架构设计,深度参与框架选型、技术路线决策,与算法团队共建高可用、高性能的端智能体系; 2、负责SLM、VLM、端侧大模型的工程化落地,攻克轻量化部署、低延迟推理、资源受限场景下的实时智能难题; 3、面向Android、iOS、鸿蒙多平台做深度适配,解决端侧算力、功耗、内存、稳定性等硬核工程问题; 4、结合LLM/Agent最新演进方向,迭代工具链与部署方案,持续提升端云协同智能的效率与体验。
1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统,主要职责包括AI系统结构设计、RAG 系统开发、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型算法的创新应用与落地。
1. Agent核心算法研发:负责AI智能体(Agent)核心算法的设计与实现,包括任务规划、记忆管理、工具调用等模块,并探索强化学习(RL)在其中的应用。 2. 模型优化与对齐:应用SFT、RLHF等对齐技术,负责模型输出的逻辑校验与“幻觉”缓解,提升Agent决策的准确性与可靠性。 3. 性能与推理优化:研究并应用量化、并行计算等技术,优化大模型推理效率,提升Agent的响应速度与运行性能。 4. 框架开发与原型验证:参与Agent框架的开发、测试与迭代,并快速将前沿算法思想转化为可交互的产品原型。 5. 大模型和产品结合:创建产品和模型训练之间的数据飞轮,构建产学研的轮转迭代。 6. 基于执行反馈的学习算法研发:使AI系统能够从实践中学习并生成更有效的训练算法,深入理解奖励函数设计、探索-利用平衡以及如何避免多样性崩溃等关键问题。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、红果短剧、番茄小说、AI搜索等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。 我们使用前沿的机器学习\大模型技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,致力于支撑字节跳动持续多元化的产品创新和高速的业务增长、基于大模型革新和重塑下一代搜索技术体系,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:全面基于LLM的Query分析、相关性、个性化预估、满意度评估、生成式检索等,全链路应用LLM/VLM,每个细节都充满挑战; 2、跨模态匹配技术:进行多模态预训练,在超大规模的多模态表征、匹配、生成等多个技术方向上持续突破,打造世界领先的多模态搜索系统; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习、Causal Inference、大模型推理等技术手段,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。