深度求索核心系统研发工程师（北京/杭州）

实习兼职全职2026-05-22地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 具备扎实的编程能力、优秀的设计能力和代码品味，具有强烈的责任心。

优先条件：
1.对主流的开源软件有…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. LLM 的成功是 ai 基础设施的成功，这是一个相当复杂的系统工程。每个成功的大模型背后，都有无数个从硬件到软件，从存储调度到算子编译器的极致优化故事，最终将这个模型的训练效率推动到了极致。而我们的工作，就是将自己的特长发挥到极致，榨干硬件上的点滴性能，加速大语言模型的研究；
2. 一个人无法穷尽 AI 核心系统的方方面面，因此我们更希望你是某个领域的专家，比如高性能计算、RDMA 网络、模型框架、算子编译器等等，能以独特经验和独到观点，从不同维度优化系统，同时具有开阔的架构视野，能够灵活地选择合适的技术来构建系统。也希望你能认同我们开放共进的企业文化，积极创新，乐于挑战，整个团队一起互通有无，博采众长，来推动整个 AGI 的发展。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

相关职位

研发工程师-北京/杭州(J250415034)

社招技术

1.参与国际化出行核心业务系统的相关研发工作 2.参与服务端业务架构设计、模块划分和开发 3.完成系统优化和重构，提供系统可用性和稳定性 4.积极跟其他团队沟通和配合，推动项目进展，讨论并提出有建设性的意见

更新于 2025-04-17杭州

通义大模型事业部-大模型推理系统研发工程师-北京/杭州

社招3年以上技术类-开发

● 为大语言模型和多模态模型设计和实现高效的分布式推理架构，支持多节点、多角色、多模型的异构复杂部署模式，以统一、可扩展的方式支持PD分离、多模态多模型分离等部署方式，以及灵活的配比、伸缩等能力。 ● 设计和实现智能的请求与模型调度能力，在高度动态的负载工况下以及多模态模型异构的子模型间做高效的调度，让分布式推理系统具备充分的动态性和适应能力，提升服务的整体效率和质量。 ● 对分布式和多模态推理引擎运行时进行深度优化，提升分布式推理的效率和稳定性：提升组件间协调的效率，降低请求延迟、提升服务吞吐；结合各类推理引擎层面优化以及量化等算法方法提升多模态模型推理效率，同时保证模型效果；提升系统在高并发下的鲁棒性，确保极端负载下的稳定性和性能；引入容错机制、自动恢复和监控报警系统，保证系统的高可用性。 ● 为分布式推理实现高效、通用的数据平面，以统一的方式支持各类数据传输（如PD分离中的KV cache、多模态推理中的中间结果）和存储（KV cache storage）等需求。 ● 持续关注并跟进业界技术发展，尤其是超长上下文、COT思维链、多模态融合等方向；积极尝试和探索新的推理优化方向，提出并验证创新性的解决方案。

更新于 2026-06-01北京|杭州

阿里云智能-云网络控制面高级研发工程师-北京/杭州

社招3年以上云智能集团

1. 负责阿里云面向AI智算场景的云网络控制系统的设计研发工作，包括技术可行性分析、方案选型、功能设计以及架构设计等工作。 2. 负责云网络控制器平台性能优化，为AI GPU计算、通用CPU计算提供极致的网络弹性需求。 3. 利用AI DevOps技术提升云网络控制器研发效率、运维效率和系统的整体稳定性，并形成标准化的运维产品方案落地。 4. 负责云网络控制器平台的线上运维和内部运营工作。

更新于 2025-09-05北京|杭州

阿里云智能-PolarDB数据库管控开发（Data+AI方向）-北京/杭州

社招5年以上云智能集团

【团队介绍】PolarDB管控团队专注打造国际一流的云原生数据库PolarDB，以“高性能、高弹性、高智能”为核心构建企业级云数据库基础设施。团队突破传统架构限制，首创计算Serverless架构（动态资源按需分配，降低成本50%+，支持百万核级CPU调度），率先实现多主架构、HTAP混合负载处理等创新技术，服务金融、电商等关键行业数万企业数字化转型。在Data+AI领域，团队构建AI节点计算框架支持向量检索/图计算等，持续探索智能数据平台新边界。作为阿里云数据库“梦之队”，团队通过软硬一体化创新，正引领全球数据库技术进入智能化新纪元。【职位描述】作为PolarDB管控Data+AI方向的研发工程师，你将深度参与PolarDB核心管控系统的设计与研发，推动云原生数据库在弹性、可靠性、智能化方向的技术突破。你将与数据库内核、存储、AI等多个顶尖团队协作，打造面向未来的下一代智能数据库平台，包括不限于： 1、负责PolarDB管控系统架构设计与核心模块开发，包括集群管理、资源调度、自动化运维、高可用容灾等 2、参与PolarDB Serverless架构应用到Data+AI场景的演进，优化弹性伸缩策略与资源利用率，提升系统性能与成本效益 3、探索Data + AI融合场景，参与AI节点调度、向量检索引擎集成等前沿方向研发 4、持续提升系统可观测性、自动化运维能力与客户体验，服务数万关键行业客户

更新于 2025-12-01北京|杭州