logo of insta360

影石数据平台开发实习生

实习兼职地点:深圳状态:招聘

任职要求


计算机、软件工程、数据科学、人工智能等相关专业
扎实的编程基础,熟悉 Python(必须)
了解数据湖 / 数仓 / 数据平台概念,接触过 Iceberg / Hive / Delta Lake / HDFS / S3  等
对 AI / 机器学习 / 深度学习训练流程有基本理解
熟悉 Linux 基本操作,具备良好的工程习惯
加分项:
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


你将参与 AI 训练相关的数据平台与工程体系建设,具体包括但不限于:
参与构建和维护 AI 训练数据集,包括设计与实现数据集的采集、清洗、版本管理、元数据管理,支持训练集 / 验证集 / 测试集的划分与追踪
参与基于数据湖的数据管理方案,编写 Spark / Python 任务进行数据 ETL、特征抽取、统计分析
参与训练日志、指标、数据漂移等基础监控能力的建设
协助构建训练 pipeline,与算法、标注、模型训练同学协作,提升整体训练效率
包括英文材料
数据科学+
Python+
Iceberg+
Hive+
Delta Lake+
HDFS+
S3+
机器学习+
深度学习+
还有更多 •••
相关职位

logo of bilibili
实习技术类

1. 为数据分析提供高效的开发工具; 2. 参与数据流/批计算平台开发; 3. 工作认真、负责、仔细,有良好的团队合作精神。

更新于 2024-07-09上海
logo of bytedance
实习A216706A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:负责公司数个产品的推荐引擎、平台开发和大数据等工作。我们的工作涉及海量数据处理和对产品数据复杂深入的分析。在这里,你可以深入钻研大数据产品的改进和优化,探索前沿的技术;可以通过对产品的深度理解和思考,将数据应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、参与字节跳动公司抖音、直播等业务的数据平台的开发工作; 2、支撑抖音、直播等业务的快速迭代,实现超大规模数据量及访问量下数据服务质量保障; 3、深入理解抖音、直播等业务并沉淀相应的数据能力,实现数据资产价值的最大化。

更新于 2025-02-17深圳
logo of bytedance
实习A127650

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:商业平台与基础架构团队负责抖音集团广告投放系统、广告AI系统、广告业务平台、广告创意平台和广告研发效能平台的建设。负责抖音、今日头条等各端上的广告业务系统研发,并且构建高并发、高性能、高可用的服务框架,设计和研发多数据中心的广告系统架构。同时推动用户行为长序列、深度学习推荐模型、多模态LLM和AIGC等先进技术在商业化场景中的应用和落地,精准匹配广告与用户需求,让营销更高效、更智能、更可持续。 1、参与抖音集团广告系统平台开发,基于现代Web开发框架、低代码技术等方案,支持抖音、今日头条等各端上的信息流广告、开屏广告、搜索广告、激励广告等广告形态的一站式流量接入和样式开发; 2、参与抖音集团广告算法大数据平台开发,支持广告算法工程师的数据管理、数据挖掘、样本建模、特征工程等方向的平台全栈开发; 3、基于商业产品的发展趋势和广告系统的技术挑战,设计相应的前端架构,支持抖音集团广告业务的长期增长; 4、跨团队协作完成整体项目规划、设计与开发工作,重点参与项目的组件开发、平台优化、业务基建等任务。

更新于 2025-01-14杭州
logo of bytedance
实习A241684

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:负责公司数个产品的推荐引擎、平台开发和大数据等工作。我们的工作涉及海量数据处理和对产品数据复杂深入的分析。在这里,你可以深入钻研大数据产品的改进和优化,探索前沿的技术;可以通过对产品的深度理解和思考,将数据应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、参与字节跳动公司抖音、直播等业务的数据平台的开发工作; 2、支撑抖音、直播等业务的快速迭代,实现超大规模数据量及访问量下数据服务质量保障; 3、深入理解抖音、直播等业务并沉淀相应的数据能力,实现数据资产价值的最大化。

更新于 2025-02-17杭州