字节跳动多模态数据湖研发专家-Data for AI
社招全职A174521A地点:北京状态:招聘
任职要求
1、本科及以上学历,计算机相关专业; 2、拥有扎实的计算机基础和良好的编程能力,精通Java或Python语言,熟悉主流的Java或Python编程框架; 3、熟悉K8S工作原理、云原生AI/大数据生态常用的开源组…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、打造业界领先的大数据+AI云平台产品,满足大模型时代的数据处理及应用需求; 2、负责云平台的架构设计和研发,包括数据处理、资源调度、模型/算子管理、模型部署服务等; 3、基于K8S体系构建大规模任务处理系统,并负责GPU、CPU等多种异构资源的编排调度优化; 4、负责云平台与字节跳动火山引擎基础设施如计算、存储、AI模型等上下游生态的集成。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
还有更多 •••
相关职位
社招2年以上A38455
1、负责多模态数据湖内核与存储引擎的研发工作,在Data+AI场景提供行业数据湖解决方案; 2、负责与上层数据处理产品深度联动,建设多模数据湖生态; 3、结合字节跳动、国内头部大模型客户场景,支持多模态数据管理需求; 4、与开源社区深度合作,提升开源影响力。
更新于 2025-05-19北京
社招3年以上技术类-数据
1、主导团队的湖仓一体、流批一体的数据技术架构的落地,并沉淀多模态的数据处理技术框架,推进整体数据架构体系的升级; 2、参与构建企业级 Data Agent,融合 LLM 与业务数据打造智能决策大脑; 3、参与供应链平台数据资产体系的建设,包括数据领域模型的规划建设以及领域知识资产化的建设,通过数据+算法+工程化+大模型的相关能力,赋能业务与产品的自动化、智能化;
更新于 2025-08-04杭州
实习淘天集团日常实习
1. 参与构建淘天全域营销知识AI基础设施,负责将海量、多源的营销业务知识(如商品信息、权益规则、活动策略、用户行为等)进行结构化、体系化的组织与沉淀; 2. 设计并开发高效、鲁棒的知识处理工作流,包括但不限于:多模态(文本、图像、结构化数据)营销数据的清洗、融合、加工与向量化,为上层AI应用提供高质量的“燃料”; 3. 探索并实践知识检索增强(RAG)架构,参与设计面向营销场景的语义检索、混合检索方案,提升AI模型在复杂营销问答、策略生成等任务中的准确性与可解释性; 4. 参与营销领域本体(Ontology)的构建与迭代,将业务专家的经验和逻辑转化为机器可理解的知识图谱,推动营销知识的标准化和智能化应用; 5. 紧密协同算法、产品及业务团队,深入理解营销业务痛点,将业务需求转化为可落地的数据与AI解决方案。
更新于 2026-02-05杭州