小红书网关高级开发工程师 / 研发专家
任职要求
任职要求: -计算机科学、软件工程等相关专业本科及以上学历,3 年以上网关开发或相关分布式系统开发经验。 -熟练掌握至少一种主流编程语言,如 Go、C++、Java 等,具备良好的代码风格和系统架构设计能力。 -深入理解网关的工作原理和核心功能,有实际的网关开发或优化经验,熟悉常见的网关技术(如 Nginx、Envoy、Kong 等)。 -熟悉网络编程、TCP/IP 协议、HTTP 协议等,具备处理高并发、分布式系统的能力。 -了解容器技术(如 Docker、Kubernete…
工作职责
职位简介:负责公司网关系统的设计、开发与优化,确保网关在高并发、复杂业务场景下的稳定高效运行,推动网关技术的创新与升级。 岗位职责: -主导公司网关系统的架构设计,包括但不限于流量管理、安全防护、服务路由等核心模块的设计与实现,满足业务快速发展的需求。 -开发高性能、高可用的网关核心功能,如请求转发、负载均衡、限流降级等,提升系统的整体性能和稳定性。 -针对不同业务场景,优化网关的性能和资源利用率,研究并应用新的技术和算法,提高网关的处理能力和响应速度。 -与其他部门(如后端开发、安全团队、运维团队等)协同工作,共同解决复杂的技术问题,确保系统之间的无缝对接和数据安全。 -跟踪网关技术的最新发展趋势,引入并评估新技术,推动公司网关系统的技术升级和创新。 -负责网关系统的性能监控与故障诊断,及时发现并解决系统中存在的问题,保障系统的持续稳定运行。 -编写高质量的代码和技术文档,为团队成员提供技术支持和指导,提升团队整体技术水平。
特斯拉信息技术部门(工作地点:特斯拉上海超级工厂)正在招聘一名全职IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统(尤其是GenAI平台)中的深入应用,亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设,并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台,以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量,将显著提升AI功能的交付效率与稳定性。 岗位职责: • 设计、构建和维护可扩展的 MLOps平台,实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架,在大规模GPU集群上开发并优化大语言模型(LLM)推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台,实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调(Fine-Tuning)流水线,支持LoRA、QLoRA等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化(量化、剪枝、蒸馏),提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求,确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化,确保可复现性与可审计性。
1、负责基础平台类服务的研发及架构升级工作,包括但不限于亿级流量网关、PUSH消息推送、长链接、IM等; 2、负责数据库中间件, 网络中间件等工作开发; 3、负责平台类服务的研发及架构升级工作; 4、分析及深入发掘现有系统的不足,定位系统瓶颈,提高系统性能和稳定性; 5、探索、研究业界的新技术方向,对去中心化/Serverless/Mesh/数据库/容器编排/调度等技术充满热情。
职位简介:负责南北向接入架构演进,包括七层负载均衡 和 GSLB全球负载均衡的开发以及相应的运维工作 岗位职责 建设高性能、高可用接入层,支持峰值数千万 QPS 的业务场景; 建设业内领先的混合云接入架构,从0-1支持QUIC/HTTP3接入; 负责南北流量的容灾架构,通过合理的容灾手段提升接入稳定性; 负责流量平台、内外网调度,高可用系统的设计和迭代,支持跨云、跨地域单元化流量调度; 负责团队内部核心产品的日常运维、调优、排障和接入平台的持续优化;