
脉脉数据科学实习生
任职要求
1. 本科及以上学历,专业不限。 2. 熟练掌握 SQL 基础,能独立完成常见 SQL 语句的编写和调试。 3. 有互联网相关实习经验者优先。(没有经历也ok,相关项目经历) 4. 具备数据分析和编程…
工作职责
1. 使用 SQL 进行数据分析,提供数据支持,整理清晰的数据报告或数据可视化图表。 2. 基于业务需求,提供解决方案和建议,并跟进实际执行情况。 3.参与公司数据看板的建设和维护,提高数据使用效率
公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)
一、岗位工作内容 (一)大模型数据处理与标注 1.对大模型生成的数学题结果,依据数学知识准确判断答案对错,并按规范进行标注。 2.深度剖析答案解析过程,核查其准确性与逻辑性,若有错误或不清晰处详细记录。 3.围绕数学题从多方面标注关键信息,如难度、知识点等,助力大模型优化。 4.结合大模型标注结果,对其标注结果进行数据分析。 (二)数据采集工作 1.依照词典笔更新需求规划数据采集方案,明确采集途径与时间安排。 2.严格检查采集数据质量,按标准分类存储,为词典笔迭代提供有力数据支撑。 二、岗位要求 (一)知识技能 1.数学功底扎实,熟悉小初高大学数学知识,能精准判断数学题答案与解析。 2.掌握数据采集流程与工具,会基本信息检索与处理,了解数据标注流程规范。 (二)个人素质 1.工作认真负责,对数据质量高度负责,注重细节。 2.学习能力强,能快速掌握新知识技能以适应工作。 3.具备团队协作精神,能与同事有效沟通合作。 (三)教育背景 本科在读及以上学历,数学、统计学、计算机科学、信息管理等相关专业优先。 (四)其他要求 1.每周出勤 5 天,实习时长最少3个月,4个月以上优先。 2.熟练使用 Word、Excel 等办公软件。
1、支持团队业务的日常数据需求,从数据上协助团队完成策略的方案制定、评估、落地及效果监控; 2、协助搭建数据指标体系,搭建日常数据监控看板,定期总结,针对异常数据能够提出建议和优化方案; 3、深入理解业务,通过数据分析痛点,产出分析报告,提出有效的解决方案。