
MomentaData infra Tech Lead
社招全职5年以上地点:北京状态:招聘
任职要求
经验门槛:5 年及以上大规模分布式系统架构设计、底层数据平台基建开发经验,具备完整复杂系统从 0 到 1 架构搭建与迭代优化经验。 编程能力:精通 Python,熟练掌握 Go/C++ 至少一门主力开发语言,具备优秀的工程化设计、代码架构与性能调优能力。 大数据基建功底:深度精通分布式数据处理技术,拥有TB/PB 级海量多模态数据存储、计算、调度、流水线开发经验,熟悉湖仓一体、对象存储、分布式计算生态技术…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责自动驾驶 & 通用大模型双赛道的数据底层基建全链路架构设计与研发,搭建支撑VLM 大模型、视频生成、自动驾驶世界模型、端到端智驾模型训练的高性能、高可扩展数据生产平台。打通图像、视频、激光雷达点云、多传感器时序数据全生命周期链路,构建行业领先的数据治理体系,用 AI 工程化能力反哺数据生产全流程,持续驱动模型迭代效率与数据质量上限。
包括英文材料
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
性能调优+
https://goperf.dev/
The Go App Optimization Guide is a series of in-depth, technical articles for developers who want to get more performance out of their Go code without relying on guesswork or cargo cult patterns.
https://web.dev/learn/performance
This course is designed for those new to web performance, a vital aspect of the user experience.
https://www.ibm.com/think/insights/application-performance-optimization
Application performance is not just a simple concern for most organizations; it’s a critical factor in their business’s success.
https://www.oreilly.com/library/view/optimizing-java/9781492039259/
Performance tuning is an experimental science, but that doesn’t mean engineers should resort to guesswork and folklore to get the job done.
还有更多 •••
相关职位
社招3-5年D2863
参与多模态数据生产相关的模型推理系统研发工作,工作内容包括: 1、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的高效部署和迭代; 2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。
更新于 2025-09-18北京
社招3年以上技术-开发
1. 负责统一数据平台的架构设计与模块开发,涵盖批处理、流处理、交互式查询与服务化计算能力,构建高效、灵活、智能的大规模数据处理基础设施。 2. 构建高效、灵活、智能的大规模数据处理基础设施,支持 PB 级的非结构化数据处理,跟踪数据技术趋势(如 Lakehouse、流批一体、云原生架构),构建高可用、易扩展的数据存储体系,支持数据湖等新型数据架构演进。
更新于 2025-09-23北京|杭州

社招3年以上数据挖掘
1、负责自动驾驶数据闭环核心系统的设计与开发,构建从车端数据采集到云端模型迭代的全链路自动化体系 2、优化车端影子模式(Shadow Mode)系统,设计高效的触发式数据采集策略,精准捕获有价值的 Hard Event 数据 3、开发智能数据筛选器(Filter),通过规则引擎与 AI 模型相结合的方式,从海量路测数据中高效筛选高价值训练样本 4、搭建云端自动化数据挖掘平台,实现异常场景、算法失效案例的自动发现与聚类分析 5、推动自动标注系统的迭代优化,自动化评估驾驶行为质量,自动化清洗坏行为数据,提升标注效率与质量 6、与EBM团队深度协作,将数据闭环产出转化为模型性能的持续提升 7、构建数据质量评估体系,确保训练数据的准确性、多样性与代表性
更新于 2025-09-19北京|上海