腾讯大数据平台后台开发工程师/技术专家(深圳/北京)
任职要求
1.计算机或相关专业本科及以上学历,3年以上大数据平台开发经验,熟悉 Linux / Unix 开发环境; 2.精通java,熟悉Python/Go至少一门语言。精通Spring Boot、Redis、MQ等框架和中间件,深刻理解JVM调优、分布式系统原理、多线程与高并发技术,并能在大数据平台组件开发、性能调优等场景中熟练应用; 3.深入理解Hadoop、Spark、Fl…
工作职责
1.负责大数据开发平台的设计实现,负责千万级 CPU 调度、PB 级存储规模下的超大规模大数据平台(如计算引擎、任务调度系统、数据接入等)的核心后端开发;保障系统在高并发、高吞吐场景下的极致稳定性与性能; 2.参与到需求评审、技术方案设计、编码实现、代码CR、功能测试等研发全流程工作; 3.与产品经理、测试运维等相关团队紧密协作,推动平台能力的高效快速落地; 4.持续优化系统架构,沉淀平台级公共服务组件,促进平台研发迭代效率,进一步提升系统性能和稳定性。
1. 建设PB级数据仓库,参与或负责数据仓库设计、建模、数据管理等; 2. 参与或负责高德地图业务支撑系统数据平台相关数据开发和管理工作,如研发、质量、保障等规范的制定与实施落地; 3. 参与导航体系和用户增值体系的核心业务,深入业务负责应用数据构建和指标体系构建以及业务数据分析&挖掘; 4. 支持各个业务的基础层数据建设工作,支持公司的BI指标&算法应用等场景; 将会接触到高德的轨迹大数据是万亿级别的,覆盖的场景也特别丰富,驾车、骑行、步行、日常的各类行为及定位等业务内容。
1、负责集团后台系统的架构设计及编码实现; 2、负责平台相关项目的系统分析、设计,并主导完成详细设计和编码的任务,确保项目的进度和质量; 3、理解业务,识别需求,参与架构、系统、分析设计等多领域项目的相关技术的实践、应用和研发; 4、能够持续关注和学习相关领域的新技术,在技术积累和创新上具有优先的经验和成果; 5、对相关岗位的研发工作支持(如代码审查,难点攻克等)。
1.负责腾讯云公有云客户云上售后SRE专家支持工作,为客户提供容灾高可用,业务部署优化,架构优化,成本优化,容量管理,业务连续性治理等方面的专家服务; 2.帮助客户进行应用部署架构的梳理与优化,通过云产品自身提供的高可用能力或者业界主流的容灾方案,为客户提供容灾高可用优化方案的设计与实施; 3.通过混沌工程等演习手段,设计并实施客户应用业务层面的容灾方案与验证; 4.对常见的互联网IT故障,设计应急预案并工具化落地,帮助客户实现容灾自动化逃生能力,达到客户业务对 RTO/RPO 要求; 5.通过产品化,工具化的思路,提升客户在云上SRE管理与治理方面的体验与效率。

团队负责研发一站式搜广推模型机器学习平台,该岗位专注于面向搜索/推荐/广告场景的机器学习分布式训练系统研发 1、负责研发搜广推稀疏大模型分布式GPU同步训练框架,支持GPU单机多卡、多机多卡训练,支持稀疏参数的多级缓存架构和异步流水训练,满足搜广推稀疏大模型离线训练、在线学习、特征准入和淘汰等算法需求; 2、负责TensorFlow/Pytorch框架的后端GPU训练性能优化,个别自定义GPU算子的cuda kernel开发和优化; 3、参与样本数据平台、搜推模型全链路解决方案、LLM4REC等重要方向的研发,提升平台的效率和易用性,加速算法同学的模型迭代效率。