心动数据工程师(内容安全 & AI 训练方向)
社招全职3年以上技术大类地点:上海状态:招聘
任职要求
基础要求: • 本科以上学历,计算机 / 数据 / 信息工程; • 3年以上数据工程经验; • 熟练掌握 SQL / Python; • 熟悉ETL流程、数据清洗、结构化与日志解析; • 熟悉 MySQL / ClickHouse / Hive / Spark 任一; • 具…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 构建UGC违规样本数据体系(文本、图片、用户行为); 2. 设计与维护数据加工流程(清洗、去噪、去重、标注、标签管理); 3. 搭建AI训练数据回流系统(人工纠错 → 样本更新 → 模型优化); 4. 建设内容风控指标体系(准确率、漏判率、错杀率、人工介入率); 5. 支持AI模型评估、版本对比与效果复盘; 6. 构建可复用数据资产管理系统; 7. 设计及维护审核系统的数据底层支撑; 8. 配合策略专家沉淀高质量违规样本库。
包括英文材料
学历+
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
还有更多 •••
相关职位
社招技术类
岗位挑战: 1、分析业务数据,理解业务标准 ; 2、跟进行业前沿进展,针对哔哩哔哩产品及用户特点制定安全策略。 岗位职责: 1、参与公司内容安全相关数据分析、策略制定和开发工作; 2、实现视觉/文本/音频领域和多模态相关算法,并将其应用在实际产品上; 3、管理内容理解工作流程,优化基建产品和工具; 3、跟进前沿技术,推进技术革新。 3、跟进前沿技术,推进技术革新。
更新于 2025-06-17上海
社招3-5年后端开发
1、负责内容安全核心系统的研发,包括不限于规则引擎、数据服务、策略运营平台; 2、负责建设&提供海量数据的存储、服务、高性能计算能力,支撑复杂的安全策略和模型; 3、具备良好的架构优化能力,并规划稳定性保障,进行高质量系统开发,包含亿级DAU产品的数据流,运营系统、审核系统等平台开发。
更新于 2025-09-29上海|北京
社招5-10年D7229
岗位介绍:作为资深技术架构师,全面负责风控业务领域的技术架构规划与实施工作。主导技术团队攻克关键性技术难题,持续推动风控系统的架构优化与技术创新,确保系统在稳定性、安全性和性能效率等核心指标上保持卓越表现。同时,深度参与业务需求分析与战略规划,通过高效的跨部门协作,将技术创新有效转化为可量化的业务价值,为公司的风控体系建设提供强有力的技术支撑。 工作内容: 1、负责风控系统的整体架构设计,确保系统的高可用性、高性能和高扩展性; 2、设计和实现风控核心模块,包括规则引擎、模型服务、实时风控决策引擎、数据存储与处理等; 3、持续优化风控系统的性能,确保系统能够处理海量数据和高并发请求; 4、跟踪业界前沿技术,探索并引入适合风控业务的新技术和新架构; 5、推动风控系统的技术演进,提升系统的迭代效率和性能。
更新于 2025-11-20北京