
哈啰服务器软件开发专家-A项目
任职要求
1. 计算机、软件工程等相关专业,5年以上后端开发的工作经验,有云端算法部署经验。
2. 熟悉服务器端编程语言…工作职责
1. 负责服务器端的软件设计,管理和性能优化。 2. 与算法工程师密切配合,实现算法在云端部署,并持续迭代和优化。 3. 与APP 开发工程师密切配合,实现云端和设备端的通讯,设备管理等功能。

1. 负责服务器端的软件设计,管理和性能优化。 2. 与算法工程师密切配合,实现算法在云端部署,并持续迭代和优化。 3. 与APP 开发工程师密切配合,实现云端和设备端的通讯,设备管理等功能。
1. 负责下一代服务器/板卡/SoC固件自主研发及产品交付和维护; 2.负责OpenBMC 相关模块的功能开发和定制化需求; 3.负责解决项目中BMC领域相关的问题; 4.负责和芯片、硬件、BIOS等研发人员沟通相关接口验证及功能开发设计方案; 5.负责项目开发过程中相关文档的编写和输出; 6. 引领BMC领域技术发展趋势,结合平头哥业务应用场景,开拓芯片/OpenBMC技术发展方向,并推动相关技术产品化落地。
特斯拉信息技术部门(工作地点:特斯拉上海超级工厂)正在招聘一名全职IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统(尤其是GenAI平台)中的深入应用,亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设,并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台,以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量,将显著提升AI功能的交付效率与稳定性。 岗位职责: • 设计、构建和维护可扩展的 MLOps平台,实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架,在大规模GPU集群上开发并优化大语言模型(LLM)推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台,实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调(Fine-Tuning)流水线,支持LoRA、QLoRA等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化(量化、剪枝、蒸馏),提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求,确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化,确保可复现性与可审计性。
职位角色 特斯拉信息技术部门(工作地点:上海超级工厂)现招聘一名全职 IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps 与 MLOps 平台。随着人工智能技术,尤其是生成式AI(GenAI)平台在企业核心系统中的深入应用,我们亟需一位能够打通 AI研发与生产部署之间壁垒 的工程专家。 您将负责从 模型训练、版本管理、自动化部署到高性能推理服务 的完整 MLOps 体系建设,并主导构建支持 本地 GPU 推理与云端 LLM API 融合 的混合式推理网关平台,以实现 低延迟、高吞吐 的企业级 AI 服务能力。作为 GenAI 平台及未来 AI 服务落地的核心力量,您将显著提升 AI 功能的交付效率与系统稳定性。 设计、构建并维护可扩展的 MLOps 平台,实现 AI 模型从训练、版本控制、部署到监控的全生命周期管理。 基于 vLLM、TensorRT-LLM、TGI 等框架,在大规模 GPU 集群上开发并优化大语言模型(LLM)推理流水线。 构建融合本地 GPU 模型与云上 LLM API 的混合推理网关平台,实现智能路由、负载均衡与性能成本优化。 搭建自动化 LLM 微调(Fine-Tuning)流水线,支持 LoRA、QLoRA 等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障 AI 系统的可观测性与稳定性。 与 AI 科学家和应用工程师协作,进行模型优化(如量化、剪枝、蒸馏),提升推理效率与资源利用率。 支持 GenAI CN 平台的高性能模型服务需求,确保低延迟、高并发的服务能力。 制定 AI 模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。 使用 GitLab CI、Jenkins、ArgoCD 等工具实现 AI 工作流的 CI/CD 自动化,确保可复现性与可审计性。