阿里云阿里云智能-云原生技术支持专家(海外业务)-北京/杭州/上海
任职要求
1、计算机通信或相关专业本科以上学历,至少5年的传统/互联网业务系统DevOps/运维/开发工作经验;具备优秀的中英文听说读写能力。 2、熟悉容器化改造、微服务拆分、应用开发等;熟悉可观测领域、产品及解决方案,包括但不限于SLS、ARMS、云监控;熟悉消息队列、函数计算、微服务和容器技术;精通至少一种开发和脚本语言(Java/C/C++/Python/Shell/Perl等)。另外满足如下3-5能力项中的至少一条。 3、熟悉计算机操作系统,有Linux或虚拟化方面的研发、运维或支持经验;熟悉进程、文件系统和网络常见系统调用,能够使用strace/gdb等类似工具分析程序行为或者能够根据源码分析程序更佳;熟悉Linux网络栈,知道内核网络参数的工作机理,了解虚拟网络设备的…
工作职责
1、作为云原生技术领域专家,为客户提供云产品的专家服务支持,负责疑难升级问题的快速定位、分析解决。 2、与研发团队对接,根据客户反馈的问题推动云产品Bug修复、架构方案优化。推进后台诊断工具、用户侧自主化诊断工具的落地。 3、整理输出官方技术文档与解决方案,指导用户合理使用云产品。 4、为客户提供企业级服务中云产品相关场景的的解决方案,协助客户完成云环境上的业务技术落地。
团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、负责AI时代的数据库架构设计:涵盖支持AI/ML工作负载的新型数据库系统架构,优化AI模型训练与推理的数据访问效率;构建支持向量搜索、图计算、时序分析等AI场景的混合型数据库解决方案,探索LLM大模型与数据库系统的深度集成方案,如自然语言SQL生成、智能查询优化; 2、负责数据库智能策略研发:研发基于 AI 的数据库性能调优系统,包括自动索引推荐、查询计划优化、资源分配策略等;构建智能监控系统,实现异常检测、根因分析、容量预测等AIOps能力;开发自适应存储引擎,根据数据访问模式动态调整存储结构; 3、负责AI数据基础设施构建:构建AI数据基础设施,如支持特征工程、模型训练、推理服务的全流程数据管道架构,实现数据库与机器学习框架(TensorFlow/PyTorch)的高效对接; 4、负责AI与数据库结合的实践方案探索与落地:探索AI技术和数据库各产品结合的最佳实践方案并落地,服务超大规模的集团内部业务及火山引擎业务。
标准化运维 • 通过风险治理、产品变更升级、故障应急等来维护客户云平台的稳定性 • 通过不断的资源与性能优化,帮助客户持续提升用云效率 • 以用户视角推动云产品运维能力可支持性持续提升,降低云平台运维难度 标准化交付(混合云) • 负责项目集成方案制定与标准化交付实施,识别和屏蔽实施前技术风险 • 负责制定云计算、大数据、AI等产品的可交付性标准、数据中心体系的质量建设与标准输出,持续提升产品的可服务性和质量,负责建立知识库、交付工具、交付流程优化及方法论; • 建设和培养生态可交付能力,帮助客户实现最终业务价值 标准化迁云 帮助客户业务迁移上云、用好数,为客户提供应用/大数据架构设计、数据库国产化,应用/大数据性能调优,数据治理以及数据中台建设等技术服务,提供云上产品在行业应用的最佳实践和解决方案。 技术支持 • 作为主要联系人,解决客户在使用阿里云服务过程中遇到的技术问题,通过风险治理、产品变更升级、故障应急等来维护客户云平台的稳定性 • 向客户提供最佳实践、指导和培训,帮助他们充分利用阿里云的功能和服务 • 向客户提供全方位的云技术支持、成本优化、成熟评估与咨询、合规与安全加固等服务,以提升客户的云上业务效率和可靠性 技术咨询和规划 作为技术专家,理解客户的IT战略和方向,结合云产品为客户提供深入的技术咨询、架构建议、产品选型等服务相关解决方案,成为客户数字化转型的长期伙伴 云上优化 • 通过对业务需求的深入理解,搭建和优化系统架构、建设业务容灾能力、设计和实施监控系统,引导日常容灾演练,以提高云上业务的稳定性和可靠性,保证高并发下的系统性能和响应速度 • 实现智能监控和预警,提升客户的业务效率和用户体验,并优化基础架构和应用程序 客情建设和商机拓展 识别客户关键决策人,用客户的语言展开对话,获取客户信任,挖掘产品和技术需求,形成有效商机并进行履约
标准化运维 • 通过风险治理、产品变更升级、故障应急等来维护客户云平台的稳定性 • 通过不断的资源与性能优化,帮助客户持续提升用云效率 • 以用户视角推动云产品运维能力可支持性持续提升,降低云平台运维难度 标准化交付(混合云) • 负责项目集成方案制定与标准化交付实施,识别和屏蔽实施前技术风险 • 负责制定云计算、大数据、AI等产品的可交付性标准、数据中心体系的质量建设与标准输出,持续提升产品的可服务性和质量,负责建立知识库、交付工具、交付流程优化及方法论; • 建设和培养生态可交付能力,帮助客户实现最终业务价值 标准化迁云 帮助客户业务迁移上云、用好数,为客户提供应用/大数据架构设计、数据库国产化,应用/大数据性能调优,数据治理以及数据中台建设等技术服务,提供云上产品在行业应用的最佳实践和解决方案。 技术支持 • 作为主要联系人,解决客户在使用阿里云服务过程中遇到的技术问题,通过风险治理、产品变更升级、故障应急等来维护客户云平台的稳定性 • 向客户提供最佳实践、指导和培训,帮助他们充分利用阿里云的功能和服务 • 向客户提供全方位的云技术支持、成本优化、成熟评估与咨询、合规与安全加固等服务,以提升客户的云上业务效率和可靠性 技术咨询和规划 作为技术专家,理解客户的IT战略和方向,结合云产品为客户提供深入的技术咨询、架构建议、产品选型等服务相关解决方案,成为客户数字化转型的长期伙伴 云上优化 • 通过对业务需求的深入理解,搭建和优化系统架构、建设业务容灾能力、设计和实施监控系统,引导日常容灾演练,以提高云上业务的稳定性和可靠性,保证高并发下的系统性能和响应速度 • 实现智能监控和预警,提升客户的业务效率和用户体验,并优化基础架构和应用程序 客情建设和商机拓展 识别客户关键决策人,用客户的语言展开对话,获取客户信任,挖掘产品和技术需求,形成有效商机并进行履约
核心业务 AI Coding 工具建设:参与IDE智能辅助插件能力丰富,从研发全流程识别智能体还可以提升效率点并集成,提升开发者编码体验与效率。 创意应用AI SaaS平台:优化AI驱动应用制作平台能力,降低创意实现门槛 D2C/R2C精度优化:参与Design to Code、Requirement to Code的AI转换精度提升,实现高质量代码生成 技术架构设计:参与定义 AI 友好相关技术栈架构与标准规范。 技术突破 模型优化与训练:基于企业私有生产资料,设计并执行大模型后训练策略 提示词工程:构建领域专属的Prompt Engineering体系,优化AI与human in the loop 交互模式 AI框架集成:深度理解LangGraph、LangChain、GraphRAG 等先进框架,构建复杂AI应用 性能优化:持续优化AI Coding工具在对话体验、任务执行精度、成本控制上的深度实践