腾讯数据中心规划专家
任职要求
1.本科及以上学历,电气/暖通相关专业背景优先; 2.8年以上数据中心从业经验,具备互联网,第三方或运营商大规模数据中心的规划/设计/运营/资源管理相关经验优先; 3.对国内外数据中心行业发展及数据中心技术架构有深刻认识,具…
工作职责
1.负责数据中心宏观面(空间/电力/弹性)的顶层设计和中长期规划,并端到端推动落地; 2.搭建数据中心资源管理平台,从需求预测/Buffer池化/建设颗粒度的动态调整等方面实现复杂业务场景下的机架弹性供给; 3.促进数据中心资源规划与新能源拓展和服务器(CPU/GPU)特性的融合,推动绿电直供/源网荷储等战略项目落地; 4.基于容量/使用率/PUE/电价/TCO等维度的经济指标分析和优化策略,搭建经营分析平台,持续降本; 5.制定数据中心生命周期的全链路管理标准,包括但不限于立项/选址/运营改造/到期续约改造/新生命周期迭代/裁撤/报废等; 6.建立腾讯数据中心技术传播策略,通过行业标准/开源项目等渠道持续提升行业影响力和合作伙伴粘性。
1、洞察业务需求及发展变化:深度分析业务发展需求和趋势,并且与需求方建立持续的对接机制,结合全球基础设施资源的情况,提出合理的IDC资源布局规划方案。 2、洞察市场与政策环境:收集和分析IDC市场动态及趋势,评估不同区域的市场需求和竞争态势,研究潜在IDC布局地点的经济环境、政策支持、基础设施及整体市场发展情况。了解并分析土地使用、用电、环保等相关政策,确保IDC规划符合当地法规要求,并针对政策对IDC布局的潜在影响提出应对策略。 3、制定IDC资源布局规划方案:评估不同布局方案的投资成本,进行利润及回报分析,为决策提供数据支持,帮助公司在不同方案之间做出合理选择,定期向管理层汇报IDC布局规划与进展,确保IDC的布局与公司整体战略一致。 4、IDC资源的容量分析与管理:建立线上化、自动化、智能化的IDC资源布局和容量管理系统,持续跟踪与分析IDC容量的状态,发现问题及根因并提出解决方案。 5、跨部门协作,保障IDC资源供给:输出IDC规划需求,与IDC排产进行握手,保证IDC资源需求的供给承接;协同商务相关团队,共同设计符合IDC资源规划和使用的商务条款,保障合规、客户权益和公司成本的平衡
我们正在寻找一位熟悉数据中心建设、服务器部署与高性能网络运维的优秀工程师,加入我们致力于构建*下一代AI算力基础设施的核心团队。 你将参与企业级GPU集群的规划、部署与持续优化,支撑大语言模型(LLM)千亿级参数训练任务的稳定运行。如果你热爱“硬核”系统工程,关注物理层到网络层的极致性能,并希望在AI时代打造真正的“算力底座”,欢迎加入! 你将负责: 1. AI数据中心规划与机房部署 参与新建或改造AI专用机房,完成服务器上架、电源配比、散热方案评估、PDU/UPS/BMC等基础设施配置,确保高密度GPU集群的可靠运行。 2. 大规模GPU集群部署与维护 主导NVIDIA A100/H100等高端GPU服务器的初始化、固件升级、驱动安装与健康监控;建立标准化部署流程(自动化装机、配置管理),提升交付效率。 3. 高性能网络架构支持(RDMA/InfiniBand/RoCE) 配合网络团队完成IB/RoCE网络部署,配置子网管理器(SM)、交换机(如 Mellanox/NVIDIA Quantum-2)、路由策略;保障低延迟、高带宽通信满足AllReduce需求。 4. NCCL通信性能调优与故障排查 协助算法团队分析分布式训练中的通信瓶颈,结合nccl-tests、ibstat、ethtool等工具进行链路诊断;优化GPU拓扑(NVLink/NVSwitch)、NUMA绑定、MTU设置等关键参数。 5. 基础设施监控与自动化运维 搭建硬件健康监控体系(温度、功耗、风扇、ECC错误等),集成Prometheus + Grafana + Alertmanager;编写脚本实现自动巡检、告警响应与故障定位。 6. 跨团队协作支持训练平台稳定运行 与开发、QA团队协同,为大模型训练提供稳定、高效的底层算力环境,快速响应宕机、链路中断、丢包等紧急问题。
一、岗位定位: 通过构建科学、高效的商品结构体系,引导品类整体商品策略从“经验驱动”向“数据牵引、结构演进”升级。负责商品结构模型搭建、结构指标定义与监控、SKU结构健康度评估,推动结构策略在采购、中台、营运、运营等业务中的落地与执行。 二、岗位职责: 1. 商品结构规划设计(结构建模主责) 1)结合用户需求趋势、销售数据与竞品结构,制定未来1–3年的结构蓝图:包含商品角色分布、价格带布局、品牌/包型比例、品质梯度等; 2)牵头建立不同一级/二级类目的结构参考模型(结构“目标图谱”); 3)输出年度《商品结构策略蓝皮书》并推动在采购团队落地。 2. SKU结构健康度评估与优化机制建设 1)负责在售SKU结构健康度分析(如:价格段分布、生命周期分布、低效SKU比例、动销贡献集中度); 2)与数据中心合作搭建结构评估指标体系和可视化看板,如“结构齐备率”“高效SKU占比”“同类替代率”; 3)定期输出《品类结构体检报告》,提出结构优化建议,包括SKU汰换、补位、合并、变更属性等。 3. 协同采购与质控推进结构落地 1)将结构策略细化为采购团队可执行的目标结构框架与SKU引入标准; 2)与中台联合设定SKU的上下限机制,结合生命周期和结构标签进行动态管理; 3)参与采购年度品类经营计划的结构审核与策略对齐。 4. 品类规划制度与策略沉淀 1)搭建商品结构管理标准体系,包括结构指标定义、结构评估方法论等; 2)整理历年商品结构调整案例、SKU表现数据,建立知识库,为策略复盘与商品培训提供支撑; 3)组织结构策略分享会与培训,提升商品人员结构意识。