小鹏汽车计算平台高级软件工程师

社招全职3年以上2025-07-22地点：广州状态：招聘

扫码手机上打开

任职要求

1. 计算机 / 软件工程硕士或同等经验，3年及以上大规模数据处理经验；有大规模模型训练与推理场景支持经验者优先；
2. 精通 Python，具备扎实软件工程基础，良好编程规范和代码质量意识；
3. 有以下至少一项实际项目经验；两项及以上者优先：
  a. 大规模数据加载机制（如 PyTorch DataLoader、NVIDIA DALI、TensorFlow Dataset、Hugging Face Datasets）
  b. Parquet/ORC 等列式存储格式及相关生态（如Petastorm)，能设计高效的分区、压缩与向量化读取流程，优化批量数据访问性能。
  c. Linux文件系统与网络I/O，能针对NFS、对象存储等场景进行性能调优；有云存储系统（如阿里云OSS、CPFS、火山引擎vePFS）相关经验。
4. 具备关系型数据库（MySQL/Po…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作，包括数据加载工具（XDataLoader）和数据集管理平台（XDataset），提供统一的数据加载、转换、缓存与预取能力；目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题，服务AI大模型的训练和推理；
2. 开发并维护高性能 DataLoader SDK，支持自定义采样、并行读取、缓存预取与数据增强等功能，优化多线程/进程流水线，降低I/O与预处理延迟，简化算法团队接入并提升加载效率；
3. 搭建通用Dataset管理系统，实现多源异构数据（图片、视频、点云、传感器等）的统一接入、解析与格式化；
4. 协同算法团队及其他技术团队，深入理解业务需求，快速响应并落地实现。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

编程规范+

PyTorch+

TensorFlow+

Parquet+

Linux+

性能调优+

MySQL+

PostgreSQL+

NoSQL+

Redis+

MongoDB+

缓存+

Apache+

Ray+

还有更多 •••

登录查看完整学习资料

相关职位

平台高级工程师-飞连

社招5年以上A120749

1、负责Devops平台/运维平台的整体架构设计和技术选型，制定技术发展路线； 2、主导Devops工具链的建设和集成，包括但不限于CI/CD、配置管理、监控告警、日志分析等工具； 3、优化和改进现有运维流程，通过自动化等方式提高运维效率，降低运维成本； 4、负责平台的性能优化、安全加固和高可用性设计，保障平台的稳定运行，并编写和维护平台相关的技术文档和操作手册，提供技术支持和培训。

更新于 2025-01-08北京

金融平台-高级测试工程师

社招5年以上技术类

1、负责金融平台实时交易链路与清结算相关业务的测试工作，包含但不限于收费计息、公司行动、期权期货、结单、税务等业务，涉及服务端、web端以及全流程测试2、参与需求评审，以专业测试视角对需求合理性进行评估，并提出建议和意见3、根据产品需求、技术方案文档，设计并执行高质量测试用例，保证对需求的全面覆盖4、运用先进测试工具和自动化方法，提高测试效率和项目质量5、持续优化测试流程，与开发、产品等跨团队协作，共同提升产品品质

更新于 2025-08-28深圳

高级软件开发工程师，AI平台

社招2年以上IT-应用软件

特斯拉信息技术部门（工作地点：特斯拉上海超级工厂）正在招聘一名全职IT AI Platform 开发工程师，专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统（尤其是GenAI平台）中的深入应用，亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设，并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台，以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量，将显著提升AI功能的交付效率与稳定性。岗位职责： • 设计、构建和维护可扩展的 MLOps平台，实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架，在大规模GPU集群上开发并优化大语言模型（LLM）推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台，实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调（Fine-Tuning）流水线，支持LoRA、QLoRA等参数高效训练方法，涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG（检索增强生成）能力服务化（RAG-as-a-Service），集成并运维主流向量数据库（如 Pinecone、Milvus、Weaviate）。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案，保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化（量化、剪枝、蒸馏），提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求，确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标（KPI）与服务等级协议（SLA），量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化，确保可复现性与可审计性。

上海

云原生高级开发工程师/专家-云原生调度方向

社招3年以上后端开发

容器统一调度与在离线混部方向岗位职责 1.负责公司容器调度平台的架构设计和核心功能开发，包括容器资源管理、调度优化、弹性伸缩等模块。 2.设计和实现在线与离线任务的混部调度方案，优化集群资源的整体利用率，实现计算、存储和网络资源的高效调度。 3.针对不同业务场景，研究并改进 Kubernetes 调度算法，包括任务优先级、抢占机制、节点选择等，提升集群的资源分配效率和稳定性。 4.与多集群管理平台、资源隔离、QoS 管理等模块协同工作，确保在复杂场景下的资源调度策略具备高可用性和可扩展性。 5.跟踪云原生生态的最新发展趋势，研究并应用新技术以提升系统性能和调度灵活性。 6.支持系统的性能监控与故障诊断，参与系统优化和技术问题的快速解决，保障系统的高效稳定运行。

更新于 2026-01-21上海|北京|杭州