Momenta资深云原生基础架构工程师/专家

社招全职2024-12-30地点：北京 | 苏州状态：招聘

扫码手机上打开

任职要求

职责描述
1、负责支持全公司Kubernetes多集群管理与GPU资源调度，优化云计算资源利用率，确保基础设施高效运行，满足大规模数据任务和GPU密集型场景需求；
2、负责Kubernetes多集群的部署、扩展及优化，确保资源高效分配；
3、构建跨集群的统一调度机制，提升集群资源利用率；
4、维护GPU节点池，监控GPU使用情况，并优化调度策略；
5、云计算资源管理与优化
  5.1 设计和维护云服务的使用策略，降低云成本，提高资源…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

无

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Kubernetes+

还有更多 •••

登录查看完整学习资料

相关职位

平头哥-AI DevOps 专家-上海

社招5年以上技术-芯片

我们正在寻找具备深厚技术功底、前瞻性视野和丰富实战经验的DevOps平台工程专家，加入我们致力于构建智能化研发基础设施的核心团队。在这里，你将主导下一代AI驱动的Devops平台与智能运维系统的设计与落地，推动软件研发流程向自动化、可观测性、自愈能力和数据驱动决策全面进化。作为团队的技术骨干，你将： 1. 设计打造企业级智能化运维（AIOps）体系基于Python、Go等语言，构建自动化运维工具链与平台化能力，实现基础设施即代码（IaC）；引入异常检测、根因分析、故障传播图谱等AI算法，提升系统可观测性与故障响应速度，推动运维从“被动响应”向“主动预防”转变。 2. 构建全链路智能监控与自愈系统设计并落地覆盖应用、服务、资源的端到端监控体系，集成Prometheus、Grafana、ELK、OpenTelemetry等主流技术栈；结合时序预测（LSTM、Prophet）、无监督异常检测（Isolation Forest、One-Class SVM）等模型，实现性能瓶颈预警、自动诊断与部分场景的闭环自愈。 3. 推动MLOps与DevOps深度融合主导机器学习模型训练流水线（ML Pipeline）与模型服务化（Model Serving）平台建设，设计模型版本管理、A/B测试、流量灰度、监控告警与快速回滚机制，支撑AI能力高效、稳定地规模化落地。

更新于 2026-03-24上海

阿里云智能-云网络系统研究工程师（AI方向）-杭州

社招3年以上云智能集团

1. 面向 AI 业务的网络架构设计与演进 ○ 负责支持大规模 AI 训练/推理集群的网络架构规划与方案设计，覆盖 AI access 网络、frontend 网络、AI scale up 网络等关键环节。 ○ 结合业务场景识别网络接入、流量调度、数据分发链路中的性能和可靠性瓶颈，提出系统级优化方案。 2. 高性能多路径传输与 RDMA 方向创新 ○ 深入调研业界前沿应用层多路径传输、RDMA 及相关协议栈优化技术，系统性分析其优缺点与适用场景。 ○ 基于阿里云大规模生产环境，设计并落地面向 AI 流量的多路径传输优化机制，实现端到端的高带宽、低时延和高稳定性。 3. 网络系统研发与产品化落地 ○ 将整体技术方案拆解为可实施的技术点，完成可行性分析、技术规范制定与验收标准设计。 ○ 主导关键模块的架构设计与核心代码开发，构建可快速迭代的原型系统，验证技术路线。 ○ 在验证基础上持续进行性能优化与工程化改造，推动方案产品化落地，并支撑大规模部署和运营。 4. 稳定性与性能优化 ○ 制定并实施面向超大规模集群的稳定性保障策略，从架构设计、协议栈实现、流控/调度策略等多层面建设高可用能力。 ○ 在真实业务环境中开展端到端性能剖析与容量规划，识别热点与瓶颈，落地针对性优化措施，保障高负载下的稳定性能表现。 5. 数智一体的网络分析与智能运维 ○ 利用大数据与大语言模型，设计并研发超大规模网络分析与智能运维系统，提升网络研发、运营、运维、测试效率。 ○ 探索 AI for Network 的创新场景，如异常检测、故障根因定位、智能调度策略优化等。 6. 学术前沿跟踪与技术影响力建设 ○ 持续跟踪计算机网络、AI infra、可编程网络硬件等领域的前沿研究与产业趋势，并评估其在阿里云场景中的落地价值。 ○ 鼓励/支持在 SIGCOMM、NSDI、ATC 等顶会发表论文或输出技术分享，增强团队和个人在业界的技术影响力。

更新于 2025-12-24杭州

资深研发工程师/Fintech技术专家-支付会员(J241210008)

社招5年以上技术

滴滴国际化Fintech业务，是滴滴国际化战略的重要组成板块。近年来，滴滴Fintech在拉美地区积极探索和开展电子支付、信贷、信用卡、商户收单等业务，为当地用户带来更便捷、优质、更高性价比的金融服务。我们诚挚邀请真诚、可靠、勇于挑战的您和我们一起，携手并肩，拥抱金融出海的浪潮，和滴滴Fintech一起快速成长。 1. 负责金融业务会员领域的系统设计和研发工作，包括但不限于核心业务、运营支撑等领域，为研发质量和系统稳定性负责。 2. 有机会主导并深度参与多个0-1、或1-100的关键项目建设，参与系统规划、讨论，共同打造业界领先的支付、金融平台。 3. 有机会学习并理解金融行业知识，了解海外的支付和金融市场，成为有国际化视野的技术专家。 4. base地：上海/杭州/北京

更新于 2025-07-23上海

资深研发工程师/Fintech技术专家-支付会员(J241225007)

社招5年以上技术

滴滴国际化Fintech业务，是滴滴国际化战略的重要组成板块。近年来，滴滴Fintech在拉美地区积极探索和开展电子支付、信贷、信用卡、商户收单等业务，为当地用户带来更便捷、优质、更高性价比的金融服务。我们诚挚邀请真诚、可靠、勇于挑战的您和我们一起，携手并肩，拥抱金融出海的浪潮，和滴滴Fintech一起快速成长。 1. 负责支付业务会员、额度中心、账单领域的系统设计和研发工作，包括但不限于核心业务、运营支撑等领域，为研发质量和系统稳定性负责。 2. 有机会主导并深度参与多个0-1、或1-100的关键项目建设，参与系统规划、讨论，共同打造业界领先的支付、金融平台。 3. 有机会学习并理解金融行业知识，了解海外的支付和金融市场，成为有国际化视野的技术专家。 4. base地：上海/杭州/北京

更新于 2025-03-17上海