字节跳动大数据架构师-电商
任职要求
1、 熟练使用Hadoop及Hive,熟悉SQL、Java、Python等编程语言; 2、 有超PB级别大数据处理实战经验,熟悉整个大数据的完整处理流程,优秀的问题…
工作职责
1、 负责字节跳动电商相关业务的大数据项目整体架构规划; 2、 负责指导工程师进行技术验证与实现,核心技术问题的攻关,解决项目开发过程中的技术难题; 3、 负责项目对外技术沟通,具有较强的沟通,表达和文案能力; 4、 根据公司项目和业务发展特点,负责研究相关大数据前沿技术。
1、负责国际化电商业务的大数据项目整体架构规划; 2、负责指导工程师进行技术验证与实现,核心技术问题的攻关,解决项目开发过程中的技术难题; 3、负责项目对外技术沟通,具有较强的沟通,表达和文案能力; 4、根据公司项目和业务发展特点,负责研究相关大数据前沿技术。
1、负责国际化电商业务的大数据项目整体架构规划; 2、负责指导工程师进行技术验证与实现,核心技术问题的攻关,解决项目开发过程中的技术难题; 3、负责项目对外技术沟通,具有较强的沟通,表达和文案能力; 4、根据公司项目和业务发展特点,负责研究相关大数据前沿技术。

- 负责大模型平台大数据层的架构设计与落地,涵盖数据采集、清洗、治理、存储、特征工程及数据服务全流程,构建适配风控场景的大模型数据支撑体系。 - 深入拆解风控核心业务场景(如交易欺诈识别、虚假交易拦截、违规商品检测、恶意差评防控等)的数据需求,结合业务同学自定义Agent的使用场景,设计针对性的数据解决方案。 - 主导搭建大模型Agent专用数据服务体系,包括但不限于RAG(检索增强生成)数据底座、向量数据库部署与优化、实时/离线数据算力调度,保障业务同学高效调用数据训练与使用Agent。 - 负责大数据平台与大模型平台的协同对接,解决数据流转中的兼容性、性能瓶颈及安全合规问题,构建稳定、高效的数据链路,支撑Agent全生命周期的数据需求。 - 牵头数据质量管控体系建设,制定数据标注、筛选及评估标准,通过数据增强、合成等技术提升数据质量,为大模型Agent的精准性提供核心保障。 - 跟踪大模型与大数据融合领域的前沿技术(如LangChain/LlamaIndex生态、多模态数据处理等),结合风控业务场景推动技术落地,持续优化数据架构与服务能力。 - 联动业务团队、大模型算法团队及工程团队,建立“业务需求-数据支撑-模型优化”的闭环机制,快速响应业务同学在Agent自定义过程中的数据痛点。 - 负责团队内部大数据技术沉淀与分享,主导数据相关规范制定,提升团队在大模型数据支撑领域的专业能力。
1. 业务数据模型设计与开发 ● 深入理解跨境电商业务,了解业务流程和商业逻辑。与产品、运营、营销、供应链、财务等团队紧密协作。 ● 负责规划、设计、维护并治理企业级数据模型(包括概念模型、逻辑模型与物理模型),确保数据架构清晰、准确、高效地表达业务,满足数据分析、运营决策需求。 ● 根据业务需求设计数据模型(如维度建模、范式建模),定义数据分层规范及数据血缘关系。设计并开发主题域数据模型(如交易、商品、用户、流量、库存等),为分析报表和业务系统提供干净、一致、可信准确数据底座。 2. 数据仓库架构设计与开发 ● 负责企业级数据仓库架构设计、分层建模(如ODS/DWD/DWS/ADS),搭建高效、稳定、可扩展的数仓体系。 ● 完成数据仓库ETL流程开发与优化,保障数据加工过程的准确性、时效性和可维护性。 3. 数据产品规划与落地 ● 深入理解业务部门数据需求,转化为可执行的产品方案,平衡技术可行性与业务价值。 ● 协调数据分析、算法、前后端团队,推动数据产品从原型设计到上线交付的全生命周期管理。 4. 跨部门协作与需求落地 ● 对接业务、分析师及算法团队,理解数据需求并提供高效数据服务。 ● 数据站点建设,推动数据资产化与自助分析能力落地。 ● 为业务团队提供数据产品培训,推动数据驱动决策文化,提升数据产品渗透率。