小鹏汽车AI Infra 后端开发工程师
任职要求
1、计算机科学、电子工程或相关领域本科及以上学历; 2、精通 Python, Golang,C++ 等编程语言; 3、精通 MySQL,Clickhouse,Redis,K8S 等常用后端服务; 4、具备出色的团队合作精神,拥有谦逊开放的态度,并且乐于持续学习。 加分项 1、有云服务,数据库,大数据相关经验; 2、有前端开发经验,如 React,Vue 等; 3、理解机器学习的基本理论,并对其应用领域有一定认知; 4、拥有机器人技术(如操作、导航)或自动驾驶领域的背景经验; 5、英文沟通与写作能力优秀,能够无障碍参与技术交流。
工作职责
1、与包括强化学习,端到端模仿学习,运控算法等团队合作,对机器人产生的海量数据进行处理,存储; 2、开发机器人的数据处理,存储管线,保证数据的高效处理,高效存储,高效获取; 3、开发机器人研发过程和数据管线中所需的各类服务,如缓存,转发,任务调度等; 4、与算法团队紧密合作,研发并提供机器人开发过程中所需各类 AI 工具。
1、与包括强化学习,端到端模仿学习,运控算法等团队合作,对机器人产生的海量数据进行处理,存储; 2、开发机器人的数据处理,存储管线,保证数据的高效处理,高效存储,高效获取; 3、开发机器人研发过程和数据管线中所需的各类服务,如缓存,转发,任务调度等; 4、与算法团队紧密合作,研发并提供机器人开发过程中所需各类 AI 工具。

支持商汤SenseCore AI智算数据中心以及大模型应用开发平台等多产品的技术设计、开发工作; 开发并维护高可用,易扩展的后端服务; 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈; 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求; 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。
1、与包括强化学习,端到端模仿学习,运控算法等团队合作,对各类关键状态,指标进行可视化,简化问题的排查,定位流程; 2、通过包括但不限于图表,3D 模型,点云等多种形式,对机器人测试过程中产生的海量数据进行展示; 3、开发机器人测试中使用的各类工具,如状态展示,数据上传等测试及开发所需工具; 4、与算法,后端等团队紧密合作,研发机器人开发过程中所需的各类 AI 效能工具。
我们正在寻找一位AI基础设施工程师,为团队 AI 软件,负责设计、构建和维护高效的持续集成与持续交付(CI/CD)流水线,提升开发团队的交付效率和质量。您将与开发、测试和运维团队紧密协作,推动自动化工具链落地,确保代码从提交到部署的全流程高效可靠。 主要职责: 1.CI/CD 流水线设计与优化: ◦搭建和维护基于 Jenkins/GitLab CI 等工具的自动化构建、测试和部署流水线。 ◦管理容器化部署(Docker)和编排系统(Kubernetes),优化镜像构建和发布流程。 ◦优化流水线性能(如并行化、缓存策略、依赖管理),缩短构建和部署时间。 ◦构建内部工具链,提升算法团队的开发效率(如实验管理、版本控制)。 2.AI 平台建设: a.设计、开发和维护分布式 AI 训练和推理基础设施。 b.构建和管理 Kubernetes(K8s)、Slurm 或其他编排系统,优化 AI 任务的调度和资源分配。 3.基础设施即代码(IaC): ◦使用 Terraform/Ansible/Pulumi 等工具管理云资源和部署环境,确保环境一致性。 ◦实现多环境(开发/测试/生产)的自动化配置和部署。 4.质量与安全管控: ◦集成代码扫描工具(如 SonarQube)、安全扫描(如 Trivy、Checkmarx)和依赖检查(如 Dependabot)。 ◦设计自动化测试策略(单元测试、集成测试、E2E 测试)并与流水线结合。 5.稳定性与可观测性: ◦设计监控和告警系统,保障 AI 服务的 SLA(如延迟、吞吐量、可用性)。 ◦实现日志追踪、性能分析和故障诊断工具(如 Prometheus、Grafana、ELK)。