logo of xiaohongshu

小红书ServiceMesh开发工程师/专家-基础技术

社招全职2年以上基础后端地点:北京 | 上海 | 杭州状态:招聘

任职要求


任职资格
1、本科及以上学历,计算机相关专业,有2年及以上相关工作经验;
2、对Golang语言熟练,具备良好的编码能力和诊断能力;
3、对 Kubernetes、Istio/Pilot 、Servi…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作职责
1、Istio/ServiceMesh 是小红书大规模注册中心的技术选型,主导和参与注册中心架构设计和研发工作;
2、参与注册中心的管控平台、Istio K8S集群运维工作
3、作为核心成员,参与可支撑千万级实例的注册中心高可用、单元容灾架构演进和落地
4、响应和处理业务侧的日常oncall、线上故障问题诊断和止损
包括英文材料
学历+
Go+
Kubernetes+
微服务+
高并发+
还有更多 •••
相关职位

logo of eleme
社招5年以上技术类-开发

1. 负责云原生框架核心组件的设计与开发,主导高可用、高性能分布式系统的技术方案制定与落地; 2. 深入参与容器化、微服务架构、服务网格等云原生关键技术的研究与工程实现,持续优化系统的可扩展性与稳定性; 3. 在C++技术栈基础上,结合Linux系统编程、网络编程及多线程并发技术,完成底层服务模块的开发与性能调优; 4. 与架构师、运维、测试及其他开发团队紧密协作,确保系统按时高质量交付并稳定运行;

更新于 2025-12-17上海
logo of itigerup
社招5年以上后端开发

作为云原生CI/CD方向高级工程师/专家,您将深度参与公司级CI/CD平台的设计、构建、优化和推广。您需要运用您在CI/CD领域的多年经验和对云原生技术的深刻理解,结合平台工程的理念,打造自动化、智能化、自助化的研发交付流水线和开发者平台,赋能业务快速迭代和创新。 主要职责: 1. CI/CD平台建设与优化: - 负责设计、开发、部署和维护公司级CI/CD平台及相关工具链(如Jenkins, GitLab CI, Argo CD, Tekton, Spinnaker等)。 - 持续优化CI/CD流程,提升构建、测试、部署的自动化水平、速度和稳定性。 - 集成代码质量扫描、安全扫描、自动化测试等工具,确保交付质量。 2. 云原生技术实践与推广: - 将云原生理念(如微服务、容器化、不可变基础设施、声明式API)融入CI/CD流程和平台设计。 - 深入研究和应用Kubernetes、Docker、Service Mesh、Serverless等云原生技术,提升资源利用率和系统弹性。 - 推动云原生最佳实践在研发团队中的落地。 3. 平台工程理念落地: - 基于平台工程理念,设计和构建内部开发者平台(IDP),提供标准化的开发、测试、部署环境和工具。 - 为开发者提供自助服务能力,降低认知负荷,提升开发者体验(Developer Experience)。 - 抽象通用能力,构建可复用的组件和模板,赋能不同业务线的快速接入和使用。 4. 技术攻坚与创新: - 解决CI/CD及云原生平台在实施和运维过程中遇到的复杂技术难题。 - 跟踪业界CI/CD、DevOps及云原生领域的最新技术和发展趋势,引入创新方案,持续提升平台能力。 - 参与制定CI/CD和云原生相关的技术规范、标准和SOP。 5. 知识沉淀与分享: - 撰写技术文档,沉淀最佳实践,进行内部技术培训和分享,提升团队整体技术水平。 - 指导和帮助团队其他成员解决技术问题。

更新于 2024-05-24北京
logo of jd
社招5年以上运维工程师岗

1.制定企业级云战略(公有云/混合云),主导技术选型与架构设计,确保高可用(99.95%+ SLA)、容灾(RTO/RPO)、安全、成本优化; 2.设计符合金融业务需求的云原生架构(微服务、容器化、Serverless),推动基础设施即代码(IaC)实践; 3.确保架构满足金融行业监管要求:等保2.0三级/四级、数据本地化存储、金融级审计日志、敏感数据加密、跨区域容灾; 4.主导安全防护体系设计(网络隔离、WAF、零信任、密钥管理),定期执行风险评估与渗透测试; 5.建立云资源管理、运维监控、CI/CD、成本治理等标准及最佳实践; 6.深入理解金融业务场景(支付、风控、交易等),将需求转化为可落地的技术方案; 7.主导重大技术选型(如云服务商、数据库、中间件),平衡技术创新与风险控制。

更新于 2025-10-20广东
logo of aliyun
社招3年以上云智能集团

1. 面向 AI 业务的网络架构设计与演进 ○ 负责支持大规模 AI 训练/推理集群的网络架构规划与方案设计,覆盖 AI access 网络、frontend 网络、AI scale up 网络等关键环节。 ○ 结合业务场景识别网络接入、流量调度、数据分发链路中的性能和可靠性瓶颈,提出系统级优化方案。 2. 高性能多路径传输与 RDMA 方向创新 ○ 深入调研业界前沿应用层多路径传输、RDMA 及相关协议栈优化技术,系统性分析其优缺点与适用场景。 ○ 基于阿里云大规模生产环境,设计并落地面向 AI 流量的多路径传输优化机制,实现端到端的高带宽、低时延和高稳定性。 3. 网络系统研发与产品化落地 ○ 将整体技术方案拆解为可实施的技术点,完成可行性分析、技术规范制定与验收标准设计。 ○ 主导关键模块的架构设计与核心代码开发,构建可快速迭代的原型系统,验证技术路线。 ○ 在验证基础上持续进行性能优化与工程化改造,推动方案产品化落地,并支撑大规模部署和运营。 4. 稳定性与性能优化 ○ 制定并实施面向超大规模集群的稳定性保障策略,从架构设计、协议栈实现、流控/调度策略等多层面建设高可用能力。 ○ 在真实业务环境中开展端到端性能剖析与容量规划,识别热点与瓶颈,落地针对性优化措施,保障高负载下的稳定性能表现。 5. 数智一体的网络分析与智能运维 ○ 利用大数据与大语言模型,设计并研发超大规模网络分析与智能运维系统,提升网络研发、运营、运维、测试效率。 ○ 探索 AI for Network 的创新场景,如异常检测、故障根因定位、智能调度策略优化等。 6. 学术前沿跟踪与技术影响力建设 ○ 持续跟踪计算机网络、AI infra、可编程网络硬件等领域的前沿研究与产业趋势,并评估其在阿里云场景中的落地价值。 ○ 鼓励/支持在 SIGCOMM、NSDI、ATC 等顶会发表论文或输出技术分享,增强团队和个人在业界的技术影响力。

更新于 2025-12-24杭州