logo of bilibili

哔哩哔哩大数据平台工具研发工程师(数据质量方向)

社招全职技术类地点:上海状态:招聘

任职要求


任职要求:
1. 熟练掌握Java技术栈,熟悉Spring BootMyBatis等框架,具备JVM调优、多线程开发经验。
2. 扎实的计算机基础:数据结构算法、操作系统、网络原理。
3. 熟悉大数据生态(Hadoop/Spark/Flink/Hive/Kafka/Presto等),有使用或开发经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作职责:
1. 负责大数据质量工具(DQC、基线、质量监控、任务运维等)的设计、开发和迭代优化,构建高可用、高性能的数据质量服务。
2. 深入理解业务需求,完善数据质量问题发现、诊断、处理、复盘能力,推动数据质量工具与业务场景的深度融合,协同上下游团队解决数据一致性、准确性、时效性等质量问题
3. 参与制定数据质量评估标准、准入标准,完善数据治理体系。
包括英文材料
Java+
Spring Boot+
MyBatis+
JVM+
多线程+
数据结构+
算法+
还有更多 •••
相关职位

logo of meituan
社招4年以上核心本地商业-基

1.承担美团服务零售业务线的数仓设计和开发工作; 2.承担业务方应用层数据的搭建和开发工作; 3.承担服务零售业务数据质量、成本、安全等各方向数据治理工作; 4.业务方数据问题的统一接口人与综合解决方案提供方,对外提供一站式服务; 5.跨团队沟通、推动数据生产链路上的问题改进。

更新于 2025-04-03上海
logo of aliyun
社招5年以上云智能产品解决方

作为合作伙伴解决方案架构师,您将负责与生态伙伴共同设计、验证并推广基于阿里云的联合解决方案,确保技术架构的领先性、可落地性及市场竞争力。您需要具备深厚的技术架构能力和行业解决方案经验,通过与合作伙伴的技术协作,将阿里云产品与伙伴技术深度融合,打造标杆级解决方案,并推动其在目标市场中的规模化推广。 核心职责 1. 联合解决方案设计与打包 • 主导与合作伙伴共同设计面向不同领域的端到端技术解决方案,整合阿里云产品(如计算、存储、AI、大数据等)与伙伴技术(如行业应用、垂直工具),确保架构的高可用性、扩展性和安全性。 • 制定技术选型标准,评估新技术/工具的适用性,并推动其与阿里云平台的集成认证(如API对接、云市场兼容性)。 • 将联合解决方案转化为可复制的技术模板或产品包,包括架构设计文档、实施指南、配置脚本、自动化部署工具等,降低伙伴实施门槛。 • 设计解决方案的技术分层架构(如IaaS/PaaS/SaaS),明确阿里云与伙伴的接口规范及责任边界。 2. 技术推广与赋能 • 通过技术研讨会、白皮书发布、客户案例分享、线上直播等形式,向合作伙伴及客户推广联合解决方案的技术优势与最佳实践。 • 协助合作伙伴完成POC验证、技术演示及客户POC,提升解决方案的市场可信度。 • 设计并实施针对合作伙伴的技术培训计划,覆盖阿里云产品集成、架构设计、API开发等关键能力。 • 编写技术文档、FAQ、故障排查手册等,形成标准化知识库,支持伙伴快速掌握解决方案实施要点。 3. 合作伙伴技术协作与交付 • 深入参与合作伙伴项目,解决技术实施中的复杂问题(如性能调优、系统兼容性、数据迁移等),确保方案落地质量。 • 与阿里云内部团队(研发、产品、交付)协作,协调资源解决技术瓶颈,推动解决方案持续优化。 • 主导或协助伙伴完成阿里云集成认证(如解决方案认证、技术兼容性认证),确保产品在阿里云市场合规上架。 4. 市场洞察与技术策略 • 深度分析(xx)领域技术趋势、客户痛点及竞争格局,提出技术路线演进建议,确保解决方案的前瞻性和竞争力。 • 结合阿里云产品,规划与合作伙伴的技术合作方向,推动联合创新。

更新于 2025-07-03北京|杭州|上海
logo of antgroup
社招1年以上技术类-质量保证

1. 全面把握产品的功能及非功能需求,基于功能需求特性设计质量保障策略。 2. 制定测试计划,设计测试用例和实现自动化,分析测试结果,排查问题和定位根因。 3. 参与产品功能架构设计评审、code review,技术风险评审,把控产品功能的可测性及风险,保障系统的线上高稳定运行。 4. 参与日常线上事件的应急、排查及问题修复,同时基于问题沉淀后续改进方向和措施。 5. 进行测试工具、测试技术、测试平台、产品研发测试过程等方面的创新,提升测试效率及日常事件发现能力。 6. 参与合作伙伴测试体系建设,团队技术规划和相关测试技术平台建设和技术输出。

更新于 2025-06-03上海
logo of jd
社招1年以上数据开发岗

1、负责自动驾驶数据闭环相关的平台研发工作,制定数据挖掘方案,计划并实施,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据闭环的标定平台、模型部署平台研发工作,通过数据及算法挖掘传感器标定异常,提前发现问题以及风险前置; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案。与算法研发工程师合作,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果。设计和开发挖掘策略/算法/工具,为感知算法任务提供研发迭代需要的数据,支持数据转化为驾驶能力; 5、综合车端的感知、规控、地图、车辆状态等信息,利用大数据技术(如 Flink、Spark)对各种异常 case 进行识别和自动化归因算法开发; 6.负责推进自动驾驶用户数据闭环平台构建、优化,确保闭环科学地、稳定地、高效地运转。基于数据湖技术(如 Hadoop、HDFS、Delta Lake 等)构建高效的数据存储、处理和分析平台。

更新于 2025-06-09北京