阿里云阿里云智能-云基础设施资源智能运营算法专家-北京/杭州
任职要求
1. 算法基础 -精通运筹优化(如MIP、动态规划)、统计建模(如时间序列预测)、机器学习(如强化学习、图神经网络)以及相关领域知识。 -熟悉大模型应用相关技术(如Prompt工程、RAG、Agentic AI框架、A2A/MCP协议),有实际应用经验者优先。 -熟悉大模型训练、部署和性能优化相关知识和技术(SFT、RLHF、知识蒸馏、lora、prefix tuning、vllm、sglang等)。 2. 工程能力 -熟练Java和Python语言,熟练运筹求解和agentic …
工作职责
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。
负责阿里云全球网络的服务化平台研发,包括但不限于平台开发、模型/算法构建、海量数据分析处理等。 阿里云基础设施网络研发事业部,负责整个阿里巴巴网络基础设施的研发、建设和运维,始终坚持利用软/硬件技术及研究,针对业务需求研发网络解决方案,给公司业务提供强有力支持。广域网架构与研发团队,作为网络研发事业部核心团队之一,负责设计、研究、建设、运营面向全球的阿里巴巴广域网络,实现网络的高可靠、高可用、低成本,并不断提升用户体验。 具体岗位职责: 1. 负责阿里全球网络的数据分析、网络优化、资源规划等自动化和智能化系统研发,包括但不限于面向稳定性保障、质量优化和成本经营的算法、模型和平台研发 2. 负责阿里全球网络的质量探测与保障、网络监控、流量采集、Qos管控等系统设计研发 3. 负责阿里全球网络流量调度系统设计和研发,实现云边一体、端网融合、全球加速等目标
1.技术与系统架构:负责具身智能与机器人系统的整体架构设计,并主导机器人平台化(硬件模块、控制栈、感知栈)与大模型平台化(数据、训练、推理)的统一设计。 2.具身智能大模型工程:建设数据体系,协同科研模型算法团队推进具身大模型训练,协同、调用云平台搭建面向具身场景的大规模训练与分布式基础设施。 3.端侧模型推理部署:负责将具身智能模型在机器人端侧部署,并结合机器人计算资源进行软硬件协同优化。 4.机器人系统落地与工程交付:主导机器人在各类场景的落地与项目交付;负责从需求拆解、系统集成、工程实现、测试验证到交付运营的全流程工程管理;协调与供应链、ODM/OEM、硬件厂商的技术对接,以及机器人产业上下游的合作。 5.团队管理与跨部门协作:管理多学科工程团队,建立工程和研发流程(CI/CD、QA、仿真体系、回归测试、可靠性验证),并与产品、科研、算法、行业解决方案和 BD 团队紧密协作推进关键项目落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责超大规模的主机系统运维&监控中心,运维中心涵盖变更发布、服务托管、配置采集,监控中心涵盖采集、存储、告警等基础能力; 2、参与产品需求设计、研发方案设计及代码开发等,编写和维护相关平台的技术文档; 3、参与海量Agent、中心调度、数据存储等关键技术的研发和优化; 4、根据业界相关技术的发展做前瞻性调研、预研工作。