饿了么饿了么-资源调度专家-杭州
任职要求
1.具备较强资源管理和统筹能力,结合预测整合外包、自营及其他资源,通过协调招聘、排班、调度、策略等多种手段让资源和业务适配; 2.具备较强渠道策略部署能力,通过人力资源管理和统筹、策略配置管理等方式落地渠道策略,提升策略的部署效果…
工作职责
1. 负责搭建客满业务线调度策略并持续优化调度策略,确保调度策略的有效性 2. 监控客满服务水平、效率、人力等运营指标,评估及把控承接风险,通过协调资源和策略,确保客户服务响应体验得到保障 3. 拟定全年不同级别的大促等级,并匹配对应级别全方位的保障方案,确保在大促高峰期,服务水平能够平稳达成目标,给客户提供持续平稳的体验
1、面向通算的弹性、混部、分布式作业调度等技术的设计和研发,满足客户不同 SLA 的资源调度;高效解决AI场景下资源协调、碎片化、隔离与干扰等技术难题。 2、面向大规模、分布式的智算场景,设计实现大模型推理服务的多角色分离式编排调度、及时准确的弹性伸缩等,实现AI模型部署优化等平台能力。 3、通过画像建设、机器学习等,为调度系统提供更加智能的决策;在保障不同类型工作负载 SLA 前提下,尽可能提升硬件利用率。 4、负责多地多中心联邦调度建设,为客户提供多种异构资源、环境需求等,保障集群合理的分布、负载。
蚂蚁算力调度团队负责蚂蚁通智算场景资源统一调度,帮助蚂蚁在线服务、大数据、AI等核心业务场景提升资源使用效率、优化工作负载性能、提高业务全局容错性和弹性资源保障。我们致力于打造高性能、规模化、有竞争力的算力调度系统,推动蚂蚁基础技术的不断创新与发展。我们重点工作领域包括: ● 研发通智算一体的高性能调度系统,支持云原生应用、分布式作业、函数任务等多种工作负载混合部署; ● 优化大规模任务调度,提升AI、大数据场景任务调度性能、优化并行计算场景作业编排; ● 结合硬件拓扑、网络架构,研发异构硬件优化调度算法,提升异构硬件下的服务/任务运行效率; ● 提升算力调度服务水平,保障大规模调度场景的服务可用性,提高系统化处理效率;

团队介绍 我们致力于通过云原生技术和不断的技术创新突破, 帮助我们的业务提升研发和运维效率,在业务高速发展的阶段,让研发把更多的精力放在创造业务价值上去。 团队贴近得物丰富的业务场景, 通过云原生CI/CD, 云原生AI, 在离线混部,边缘部署, 多云管理, 集群管理等为得物技术带来了成本的降低和效率的提升。 岗位职责: 1. 负责混部管理系统的开发, 包括调度能力强化, 内核资源隔离, 内核能力增强, 及相关的稳定性组件建设 2. 负责弹性容量体系的开发, 包括HPA&VPA, 水位平衡,容量预估等功能 3. 负责k8s相关组件的开发, 包括网络组件, 存储组件及容器运行时