
文远知行高级数据分析师
社招全职3年以上地点:广州状态:招聘
任职要求
1、必备经验: 硕士及以上学历,数学、统计学、计算机、数据科学等相关专业。 3年以上数据分析相关工作经验,有互联网、物联网或自动驾驶行业数据平台、运营效率分析经验者优先。 有独立设计业务指标体系并搭建数据看板的成功经验。 2、核心能力: 高超的数据分析能力:精通SQL,熟练掌握Python(Pandas, NumPy, Matplotlib/Seaborn等)进行数据清洗、分析和可视化。 卓越的指标设计能力:能够从复杂的业务流程中抽象出关键问题,并将其转化为可量化、可追踪的核心指标。 深刻的数据洞察与怀疑精神:对数据有极强的敏感度,不满足于表面现象,能主动挖掘数据背后的业务真相,具备甄别数据真实性的能力。 业务理解与沟通能力:能快速理解自动驾驶数据业务逻辑,具备出色的跨团队沟通能力,能将分析结果清晰地传达给非技术背景的同事。 3、加分项: 了解自动驾驶数据(如传感器数据、标注数据)的基本特性和流程。 有数据平台开发、数据仓库建设或A/B测试系统的使用和设计经验。 具备一定的项目管理知识,能评估分析项目的影响力和优先级。
工作职责
工作地点:上海、广州、北京 团队目标: 我们致力于构建世界一流的自动驾驶数据闭环体系。您将成为团队中的“数据科学家”与“价值度量官”,通过深度洞察和数据驱动,量化数据闭环各环节的效能与质量,确保我们交付的每一份数据都能高效、精准地驱动算法进化,成为公司核心竞争力的基石。 1、数据闭环效能度量体系设计: 构建并持续优化数据从“采集需求提出”到“算法消费”的全链路核心指标体系。 设计科学、可量化的指标,如:端到端交付周期、数据质量有效率、场景覆盖度、数据利用率、算法迭代收益关联度等。 深入业务,理解算法迭代流程,建立数据服务对算法效能提升的价值归因模型。 2、深度洞察与根因分析: 基于指标体系,主动发现数据闭环中的效率瓶颈、质量洼地与资源浪费。 运用统计学方法和数据分析工具,进行深度根因分析。例如:交付延迟是源于采集困难、标注堆积,还是需求变更?质量下降是特定场景、特定供应商还是标注标准模糊导致? 对数据的真实性和有效性具有敏锐的洞察力,能识别并排查数据异常、逻辑错误及潜在的“数据造假”行为。 3、数据产品与看板驱动决策: 主导开发和维护直观、实时的数据驾驶舱与可视化看板,为TPM、运营、执行及管理层提供决策支持。 将分析结论产品化,推动建立自动化监控预警机制(如:交付周期超时预警、质量波动预警)。 4、驱动业务优化: 与数据策略、运营、执行团队紧密协作,将数据分析结论转化为具体的流程优化建议、资源调配方案和质量改进措施。 通过数据反馈,驱动采集策略、标注标准、工具链的持续迭代。
包括英文材料
学历+
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Pandas+
[英文] 10 minutes to pandas
https://pandas.pydata.org/docs/user_guide/10min.html
This is a short introduction to pandas, geared mainly for new users.
[英文] Cookbook - pandas
https://pandas.pydata.org/docs/user_guide/cookbook.html#cookbook
This is a repository for short and sweet examples and links for useful pandas recipes.
https://www.kaggle.com/learn/pandas
Solve short hands-on challenges to perfect your data manipulation skills.
https://www.youtube.com/watch?v=2uvysYbKdjM
I'm super excited for this one. We're doing another complete Python Pandas tutorial walkthrough.
https://www.youtube.com/watch?v=Mdq1WWSdUtw
Filtering, Joins, Indexing, Data Cleaning, Visualizations
NumPy+
https://numpy.org/doc/stable/user/absolute_beginners.html
NumPy (Numerical Python) is an open source Python library that’s widely used in science and engineering.
[英文] NumPy - Learn
https://numpy.org/learn/
Below is a curated collection of educational resources, both for self-learning and teaching others, developed by NumPy contributors and vetted by the community.
https://www.kaggle.com/code/themlphdstudent/learn-numpy-numpy-50-exercises-and-solution
This kernel uses exercises of NumPy from the Machine Learning Plus webpage
https://www.youtube.com/watch?v=KHoEbRH46Zk
If you've heard of Pandas and NumPy, you may think one is simply a superset of the other.
https://www.youtube.com/watch?v=QUT1VHiLmmI
Learn the basics of the NumPy library in this tutorial for beginners.
https://www.youtube.com/watch?v=VXU4LSAQDSc
This video serves as an introduction to the NumPy Python library.
Matplotlib+
https://matplotlib.org/stable/tutorials/index.html
This page contains a few tutorials for using Matplotlib.
https://www.youtube.com/watch?v=c9vhHUGdav0
This video serves as an introduction to the Matplotlib Python library.
https://www.youtube.com/watch?v=OZOOLe2imFo
In this video we do a complete Matplotlib crash course in Python.
Seaborn+
https://realpython.com/python-seaborn/
If you want to take your statistical visualizations to the next level, you should master the Python seaborn library to produce impressive statistical analysis plots that will display your data.
https://seaborn.pydata.org/tutorial/introduction.html
Seaborn is a library for making statistical graphics in Python.
https://www.youtube.com/watch?v=6GUZXDef2U0
This video provides complete coverage of Seaborn with many real world examples.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
相关职位
社招5年以上信息技术类
1.分析商品在开发、生产、销售、售后等各环节数据,监控kpi;并为企划PM提供数据分析报表底表,框架搭建; 2.跟进重点项目,独立承担商品进销存领域的专项分析,为商品企划提供业务诊断和决策支持; 3.以商品端为出发点,为增长指明方向。
更新于 2025-05-29
社招3年以上全球运营类
1、负责品类业务数据分析工作,搭建品类数据分析体系,制定数据分析规划,输出可视化报告; 2、整体理解前端到后端全链路业务,跟踪人群维度及商品维度的业务数据,支持团队进行商业分析,持续提升品类销售额及各项业绩表现; 3、监控数据波动和异常,通过数据分析发现业务问题和机会点,并能提出有效的解决策略; 4、关注行业动态,定期输出专业行业和竞争维度的数据分析,帮助团队提升竞争优势。
更新于 2025-05-29
社招全球运营类
1、分析业务需求本身合理性;提供业务分析所需的原始数据或Tableau可视化看板;同时,能输出自己的分析建议,并推动落地 2、深入了解业务,主动通过数据挖掘业务机会点,输出逻辑清晰的专项分析报告,提出业务视角的解决方案,赋能业务。
更新于 2024-09-29