快手Java后端研发工程师/专家(实验平台)-【数据平台】
任职要求
基础要求 1、 3~5年 Java 开发经验,精通SpringBoot、Netty等框架; 2、熟练使用MySQL、Kafka、Redis 等中间件; 3、有高并发SDK/Agent开发经验,掌握JVM调优。 优先录用 1、参与过AB实验平台或其他数据产品架构设计; 2、具备大数据引擎应用能力,熟悉使用Spark、C…
工作职责
1、高并发实验平台建设; 设计亿级QPS用户分流系统,开发低侵入式Agent/SDK,支撑短视频、直播、商业化等核心业务AB实验;攻克复杂场景性能瓶颈(如亿级QPS实验入组数据实时上报),支撑万级并行实验在业务系统的稳定运行; 2、基于大数据引擎的架构优化;主导实验数据生产链路架构升级,实现秒级数据计算,替代传统Spark天级时延;设计高性能高可靠实验数据分析方案,解决百亿量级指标毫秒级查询和数据异动归因; 3、智能化实验引擎开发;集成AI能力实现智能异动归因(自动定位指标波动根因)、实验效果预测(迁移学习模型预判策略收益);构建自动化实验报告系统,输出统计显著性分析及业务决策建议。
1. 负责AB实验平台核心子系统(实验管理/流量管理/指标计算)的架构设计、技术攻坚与演进优化,保障亿级流量下高可用、高性能与数据一致性 2. 熟悉A/B测试统计原理,推动分层实验/动态流量分配等前沿技术落地,主导大数据与云原生技术栈升级 3. 技术权赋能全集团,对接业务/算法团队提供解决方案,推动平台推广与体验优化 4. 构建高可用体系,主导技术规范与质量保障,提升稳定性
1、参与滴滴大数据分析平台产品的研发,主要包括数据可视化、数据解读等能力建设,为公司提供数据化运营和决策支持; 2、深度参与产品需求评审和设计,能够对产品设计提出自己的见解,在理解产品的基础上进行抽象和架构设计; 3、对负责的模块能够进行持续的优化和性能提升,并积极拓展创新场景
阿里云PAI团队致力于打造业界一流的一站式AI工程化平台,拥有万卡级训练能力与超大规模异构资源调度技术,为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施,也作为公共云服务的关键载体,支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持,全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为平台研发工程师,您将深度参与以下工作: 1. 负责大规模异构资源管理与模型训练服务的全流程开发,包括需求分析、架构设计、软件开发、质量保障与部署上线。 2. 持续开展系统模块的深度剖析与迭代优化,提升资源利用效率、任务成功率与启动速度,降低使用门槛,增强产品满意度与客户粘性。 3. 负责平台线上环境的实时监控、故障定位与性能调优,为客户提供及时的专业技术支持,保障平台服务的高可用与高稳定运行。 4. 紧密追踪大模型、AIGC等前沿技术趋势,洞察并提炼高价值用户需求,推动平台功能持续演进与技术架构升级。