哈啰服务器软件开发专家-A项目

社招全职5年以上技术2025-07-15地点：上海状态：招聘

扫码手机上打开

任职要求

1. 计算机、软件工程等相关专业，5年以上后端开发的工作经验，有云端算法部署经验。
2. 熟悉服务器端编程语言…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责服务器端的软件设计，管理和性能优化。
2. 与算法工程师密切配合，实现算法在云端部署，并持续迭代和优化。
3. 与APP 开发工程师密切配合，实现云端和设备端的通讯，设备管理等功能。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

后端开发+

还有更多 •••

登录查看完整学习资料

相关职位

服务器软件开发专家-A项目

社招5年以上软研类

1. 负责服务器端的软件设计，管理和性能优化。 2. 与算法工程师密切配合，实现算法在云端部署，并持续迭代和优化。 3. 与APP 开发工程师密切配合，实现云端和设备端的通讯，设备管理等功能。

更新于 2025-11-18上海

平头哥-BMC平台开发专家-上海

社招5年以上技术-芯片

1. 负责下一代服务器/板卡/SoC固件自主研发及产品交付和维护； 2.负责OpenBMC 相关模块的功能开发和定制化需求； 3.负责解决项目中BMC领域相关的问题； 4.负责和芯片、硬件、BIOS等研发人员沟通相关接口验证及功能开发设计方案； 5.负责项目开发过程中相关文档的编写和输出； 6. 引领BMC领域技术发展趋势，结合平头哥业务应用场景，开拓芯片/OpenBMC技术发展方向，并推动相关技术产品化落地。

更新于 2026-01-19上海

高级软件开发工程师，AI平台

社招2年以上运维开发

特斯拉信息技术部门（工作地点：特斯拉上海超级工厂）正在招聘一名全职IT AI Platform 开发工程师，专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统（尤其是GenAI平台）中的深入应用，亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设，并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台，以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量，将显著提升AI功能的交付效率与稳定性。岗位职责： • 设计、构建和维护可扩展的 MLOps平台，实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架，在大规模GPU集群上开发并优化大语言模型（LLM）推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台，实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调（Fine-Tuning）流水线，支持LoRA、QLoRA等参数高效训练方法，涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG（检索增强生成）能力服务化（RAG-as-a-Service），集成并运维主流向量数据库（如 Pinecone、Milvus、Weaviate）。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案，保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化（量化、剪枝、蒸馏），提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求，确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标（KPI）与服务等级协议（SLA），量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化，确保可复现性与可审计性。

上海

全栈开发工程师，AI，上海

社招2年以上IT-基础架构与

职位角色特斯拉信息技术部门（工作地点：上海超级工厂）现招聘一名全职 IT AI Platform 开发工程师，专注于构建和扩展下一代 AIOps 与 MLOps 平台。随着人工智能技术，尤其是生成式AI（GenAI）平台在企业核心系统中的深入应用，我们亟需一位能够打通 AI研发与生产部署之间壁垒的工程专家。您将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整 MLOps 体系建设，并主导构建支持本地 GPU 推理与云端 LLM API 融合的混合式推理网关平台，以实现低延迟、高吞吐的企业级 AI 服务能力。作为 GenAI 平台及未来 AI 服务落地的核心力量，您将显著提升 AI 功能的交付效率与系统稳定性。设计、构建并维护可扩展的 MLOps 平台，实现 AI 模型从训练、版本控制、部署到监控的全生命周期管理。基于 vLLM、TensorRT-LLM、TGI 等框架，在大规模 GPU 集群上开发并优化大语言模型（LLM）推理流水线。构建融合本地 GPU 模型与云上 LLM API 的混合推理网关平台，实现智能路由、负载均衡与性能成本优化。搭建自动化 LLM 微调（Fine-Tuning）流水线，支持 LoRA、QLoRA 等参数高效训练方法，涵盖数据预处理、分布式训练与检查点管理。推动 RAG（检索增强生成）能力服务化（RAG-as-a-Service），集成并运维主流向量数据库（如 Pinecone、Milvus、Weaviate）。通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案，保障 AI 系统的可观测性与稳定性。与 AI 科学家和应用工程师协作，进行模型优化（如量化、剪枝、蒸馏），提升推理效率与资源利用率。支持 GenAI CN 平台的高性能模型服务需求，确保低延迟、高并发的服务能力。制定 AI 模型服务的关键性能指标（KPI）与服务等级协议（SLA），量化业务价值与系统表现。使用 GitLab CI、Jenkins、ArgoCD 等工具实现 AI 工作流的 CI/CD 自动化，确保可复现性与可审计性。

上海