logo of xiaohongshu

小红书【2027届】大模型推理研发实习生-创作发布

实习兼职引擎地点:北京 | 上海 | 广州状态:招聘

任职要求


职位要求
1、本科及以上学历在读,计算机相关专业优先;
2、熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言;
3、了解Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期>3个月及以上的项目实践机会。
团队介绍:创作发布团队负责小红书“+”号入口,是全平台用户笔记发布的核心能力模块,承载着内容生成、处理与分发的关键任务。我们希望通过智能化技术,持续提升内容创作效率与用户体验。
在这里,AI 引擎工程师将聚焦于结合小红书内部业务特点,对“端 & 云 AI 推理引擎”进行深度优化,从模型能力构建、框架适配,到端云协同部署,推动算法真正落地业务,构建完整的推理闭环。
你将接触并支持的算法方向包括:AIGC、文本与多模态大语言模型(LLM)、音频处理、基础视觉等多个前沿领域。这些模型往往结构复杂、实时性要求高,对底层推理性能提出了极高挑战。

1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理;
2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度,KVCache-centric调度,实现动态、及时、准确的扩缩容管理;
3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度,充分发挥大规模分布式集群算力;
4、参与大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复;
5、参与多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布。
包括英文材料
学历+
Linux+
C+++
Go+
Python+
Bash+
Kubernetes+
还有更多 •••
相关职位

logo of siemens
实习研发

N/A

更新于 2025-11-30北京
logo of bytedance
实习A253623

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05上海
logo of bytedance
实习A19983

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05北京
logo of bytedance
实习A185078

团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题背景: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。

更新于 2025-02-26北京