百度大模型驻场服务工程师(J86487)
任职要求
-计算机或相关专业,本科及以上学历,3年以上中大型系统维护经验,具备大厂AI私有化项目运维经验优先 -熟练使用Linux操作系统、k8s,掌握至少一门脚本语言;如:Shell,Python等 -熟悉安装和使用,如:MongoDB、MySQL、Nginx、kafka等 -对docker容器,镜像,网络,存储,持久化,监控,有一定的理解;有生产环境k8s/kubernetes等容器编排工具运维经验者…
工作职责
-负责百度智能云AI私有化相关软件产品的技术支持工作,主要包括客户的问题和故障响应处理以及软件的更新支持等。 -提供驻场运维支持服务,跟后端支持团队一起,快速解决客户的使用问题和故障,能够制定相关技术解决方案,合理管理客户的预期。 -负责技术运维相关的文档、手册、流程编写整理,整理分析用户问题和意见、及时反馈并推动产品质量改进、完善服务及质量。 -深入了解客户的IT和业务需求,帮助提升客户的运营水平,建立长期的信任关系,确保客户对产品服务的满意度
业务主要方向 • 交付履约平台研发,主要面向:阿里云的对客混合云履约,国际项目履约,专有云项目履约。 • 专有云技术服务平台研发,主要:为阿里云专有云驻场运维服务提供业务平台,保障客户驻场安全。提供专有云工单服务平台,帮助专有云的专家对客进行工单服务。 • 平台智能化方向,主要:结合大模型,对平台进行智能化改造,提高平台的效率,并帮助平台客户提供更智能化的服务。同时将成功经验对外商业化输出。 技术方案设计&技术实现 • 能够针对业务和产品的需求,在技术阶段:进行技术架构设计。在编码阶段:进行代码开发。部署阶段:推动代码CR,成功部署,并保证系统稳定性。 项目管理 • 自己能够把控节奏,确定项目的开发节奏和上线节奏。明确合作的岗位职责并进行任务分配。 • 总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结
客户贴身技术服务 • 技术问题处置:持续关注并分析客户用云技术问题,通过对客户业务的深入理解协助客户完成技术案例的快速高效处置。 • 需求追踪:在各行业结合客户业务场景和云产品使用情况,对客户使用情况和需求进行正确分析,挖掘真实产品需求并协助产品持续优化。 稳定性支持与保障 • 应急保障:重大故障问题的应急处置,协助业务快速恢复,故障逃逸等保障工作 • 风险巡检:针对客户使用云产品,进行使用负载,业务容量,风险事件,变更通知等巡检 • 主动服务:结合客户云上业务,制定关键架构监控和告警方案,实现智能监控和预警,提升客户的业务效率和用户体验。 • 全链路评估:对客户业务全链路调用评估,结合业务调用的云上/云下一体化风险评估,关键链路使用建议和风险提醒 • 高可用演练:围绕架构高可用方向,配合客户进行极端场景的高可用演练,模拟故障场景,演练业务逃逸实施并参与总结 • 活动护航:客户重大业务高峰活动护航,包括活动业务架构梳理,前置产品风险巡检,性能压测,故障演练,驻场保障等 云上业务治理与优化 • 用云优化:对客户新产品选型、产品使用方式、支撑行业最佳实践方案,规避通用行业客户使用误区,提炼围绕客户的最佳用云实践方案 • 云上资源管理:协助客户进行云上资源管理,业务资源使用率分析、容量管理和弹性伸缩方案保障 • 卓越架构支持:围绕卓越架构目标,对安全合规、稳定性、成本优化、高效性能方案等全方面优化工作支撑 服务保障 • 服务管理:为客户在云上使用过程中制定合理的服务及交流渠道,提供线上,现场,多项目多部门关键人员的服务交流方案支持,确保关键事件及重点项目的进展信息有效性,推进项目进展顺利落地。 • 项目支持:在客户使用云产品期间根据需求提供多样化的技术保障专项,并结合云产品特性和客户使用情况制定对应技术方案执行路线,保障技术专项的有效交付。 • 满意度保障:为企业客户满意度负责,从问题快速解决到项目平稳交付,并持续提供有效的云上使用建议和稳定性保障方案整体提升客户用云满意度。
1.核心风控模型研发与迭代: 主导或独立负责信贷风控全流程(包括但不限于反欺诈、申请评分、行为评分、催收评分等)的核心算法模型的设计、开发、验证与部署。 持续监控、评估线上模型的表现,并根据业务变化和模型效果进行快速迭代和优化,确保模型的稳定性和有效性。 2.数据挖掘与特征工程: 深度挖掘和分析内外部多维度数据(如信贷数据、用户行为数据、第三方征信数据等),构建并完善用户风险画像及特征体系。 运用创新的特征工程方法,从海量、复杂的数据中提炼出对风险有强区分度的变量,为模型性能的提升提供坚实基础。 3.前沿算法探索与应用: 跟进并研究业界在数据挖掘、机器学习、深度学习、图计算等领域的最新算法和技术趋势。 积极探索和评估前沿算法(如无监督学习、大语言模型等)在信贷风控场景中的应用价值,并推动其在实际业务中落地。 4.风险策略支持与业务赋能: 与风险策略、产品及业务团队紧密合作,深入理解业务痛点,将模型结果转化为可落地的风控策略,提供数据驱动的决策支持。 通过数据分析和模型洞察,为业务部门提供关于客群准入、额度管理、动态定价、风险预警等方面的专业建议。 5.技术沉淀与知识分享: 负责撰写清晰、完整的技术文档和模型报告,沉淀项目经验和知识。 在团队内部进行技术分享和培训,引领团队成员共同成长,提升团队整体的算法能力和风控水平。
-作为百度私有云在客户侧的售后一号位,全流程深入了解大型企业业务场景,与客户的系统运维,应用架构等人员合作,提供私有云产品的售后运维,包括但不限于组织现场进行云平台变更,对接客户需求 -基于百度私有云&AI的产品线、技术体系,帮助企业级客户制定IT架构和业务流程,包括定制的最佳实践、异常处理机制和问题应急预案等。帮助客户深度理解云服务,并持续帮助客户提升技术能力 -保障百度云平台的稳定运行,负责客户云平台的故障应急响应,后端协调,应急止损,协调产研出具故障报告,负责客户侧汇报和复盘 -推动百度云智能产品不断优化,解决客户使用云计算服务和解决方案过程中的技术问题,不断完善问题处理机制和流程,与云服务专家、产品专家直接合作,确保企业技术问题高效地解决 -现场一线驻场人员的日常运维工作管理,以及绩效考核,现场运维流程制定等运维管理工作