滴滴后端专家工程师-安全技术(策略方向)(JR2026011500A)
任职要求
1、计算机系统、算法、安全或相关专业,5年及以上工作经验,具备业务风控、内容安全相关技术背景; 2、语言不限,有良…
工作职责
1、负责规划和迭代安全技术平台,搭建更高效、稳定、可扩展的决策引擎、模型服务平台及研发工具链,为业务提供坚实的技术底座。 2、主导设计与优化以AI和数据驱动的防控方案,深度挖掘数据价值,推动决策流程的智能化和自动化升级。 3、负责持续优化系统应用架构,支持风控策略快速迭代、模型AB实验、多场景灵活配置的架构体系,提升算法工程效率。 4、参与设计千亿级数据毫秒级响应的实时决策架构,涉及优化分布式计算、流批一体数据处理、内存计算等关键技术路径,有效提升高并发场景下的性能。
1. 稳定性体系规划与落地(质量侧): 负责业务线整体生产安全与稳定性保障体系的建设。作为质量侧代表,与 SRE、业务研发团队紧密协同,制定并落地高可用架构标准。 从业务视角出发,定义稳定性衡量标准(SLA/SLO),并推动技术团队达成稳定性指标(如降低故障率、缩短 MTTR)。 2. 红蓝对抗与全链路演练(质量侧): 主导或参与常态化的红蓝对抗演练。负责设计高复杂度的业务故障场景(蓝军视角/导演视角),验证系统的容灾能力和团队的应急响应能力。 协同 SRE 建设故障注入平台,推动“以演代战”,确保应急预案的有效性和自动化执行率。 3. 变更风险管控: 建立严格的变更管控机制(发布红线、灰度策略、回滚机制)。 建设“变更防御”能力,利用自动化手段拦截高风险代码和配置进入生产环境,治理因变更导致的稳定性问题。 4. 线上巡检与业务核对(BCP): 建设分钟级的业务一致性核对系统,确保在系统未报错但业务逻辑异常(如资金损失、数据不一致)时能快速发现。 补齐监控盲区:不仅关注系统监控(CPU/内存等),更要补齐业务监控盲区。
我们正在寻找一位兼具后端开发功底与系统级视野的优秀工程师,加入我们致力于构建高性能软件研发基础设施的技术团队。 在这里,你将深度参与企业级编译系统、构建流水线与自动化发布平台的建设,专注于提升大规模项目的构建效率、稳定性和可复现性。如果你热爱底层技术、关注编译性能与构建可靠性,并希望在复杂工程场景中打造高效的研发基座,这正是为你准备的舞台! 你将负责: 1. 设计与维护高性能 CI/CD 构建平台 基于 Jenkins、GitLab CI 或自研系统,搭建支持多语言(C/C++/Go/Python)的自动化构建流水线;优化构建缓存、依赖管理与并行编译策略,显著缩短构建时间。 2. 构建和优化编译环境与工具链 管理和维护基于 GCC、Clang/LLVM的标准化编译环境,支持不同版本共存与按需切换;定制编译参数、警告规则与静态分析流程,提升代码质量与一致性。 3. 推动构建可重复性与确定性编译(Reproducible Builds) 实现构建过程的环境隔离(Docker/Singularity)、依赖锁定与输出校验,确保“一次构建,处处一致”,满足安全审计与发布合规要求。 4. 性能分析与构建加速优化 使用 time, strace, perf, Bear, compile_commands.json 等工具分析编译瓶颈;集成分布式编译方案(如 Incredibuild、distcc、sccache)或增量构建机制,提升大型项目编译速度。 5. 构建全链路可观测性系统 搭建覆盖构建耗时、失败率、资源消耗的监控体系,集成 Prometheus + Grafana;实现构建日志聚合、错误自动归因与趋势预警。 6. 推进基础设施即代码(IaC)与平台化能力建设 使用 Terraform/Ansible 自动化部署构建节点与编译集群;通过 API 和 Web 控制台提供自助式构建服务,提升研发效率。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡等地均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 1、负责开发数据安全中台服务,为字节跳动海内外产品提供数据安全和隐私支持; 2、负责搭建API网关服务,并开发数据分级分类、数据自动识别、假名化/匿名化等数据实时保护机制; 3、负责搭建数据资产管理平台,为业务研发、法务、合规运营等团队提供内部数据资产和数据策略管理能力; 4、负责建设数据安全与隐私ToB产品,对内部沉淀的相关技术能力进行产品化和商业化开发,满足外部客户的数据保护及合规需求; 5、学习掌握各类前沿隐私保护技术,与公司内外部领域专家展开合作,并在实际业务场景中对相关技术进行落地。