小米热设计大数据开发实习生

实习兼职2025-08-05地点：北京状态：招聘

扫码手机上打开

任职要求

1.本科及以上学历，计算机、软件工程、通信、网络及相关专业，具有良好沟通能力和学习能力；
2.熟悉Hadoop/Spark/Storm/Kafka等大数据相关工具，有相关项目经验者优先；
3.对Springboot，Mybatis等…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.利用Springboot等进行热大数据平台后端和数据库开发；
2.探索大模型在大数据的应用和落地，端到端开发和落地；
3.大数据后端开发文档规范的撰写；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Hadoop+

Spark+

Apache Storm+

Kafka+

大数据+

Spring Boot+

还有更多 •••

登录查看完整学习资料

相关职位

后端开发实习生-番茄小说

实习A118410

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：番茄小说是抖音在 2019 年推出的免费阅读产品，致力于为读者提供优质的阅读体验。番茄小说拥有海量正版小说，涵盖言情、都市、玄幻、悬疑等主流网文类型，以及大量热剧原著和经典出版物，支持用户看书、听书。 1、负责字节跳动番茄小说等多业务方向的服务端开发工作； 2、负责架构设计和开发，为亿级用户提供优质顺畅的信息服务和极致体验； 3、参与设计系统技术方案，核心代码开发和系统调优； 4、参与制定代码规范、测试规范，建立起开发质量控制方法； 5、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关； 6、参与各专项技术调研，新技术引入等前瞻项目；参与机器学习与异构计算系统研发；参与大模型应用开发。

更新于 2024-02-22北京

推荐特征工程实习生-抖音/直播/电商/剪映-筋斗云人才计划

实习A73923

团队介绍：字节跳动推荐架构团队，负责字节跳动旗下相关产品的推荐系统架构的设计和开发，保障系统稳定和高可用；负责在线服务、离线数据流性能优化，解决系统瓶颈，降低成本开销；抽象系统通用组件和服务，建设推荐中台、数据中台，支撑新产品快速孵化以及为ToB赋能。课题介绍： 1、课题背景在人工智能技术高速发展的背景下，推荐系统作为信息过滤与个性化服务的核心，面临多重挑战：（1）数据爆炸与模型复杂化用户行为序列数据量呈指数级增长（百亿至千亿级/日），存储需求从单用户长序列扩展至多模态数据（文本、视频、Embedding等），传统存储架构面临读写性能瓶颈与成本压力；推荐大模型对数据质量敏感度提升，数据分布异常可能导致模型效果显著下降，亟需系统性数据质量评估与改进方法。（2）异构计算与多模态处理需求随着生成式AI（GenAI）的普及，多模态特征处理成为刚需，传统基于CPU的大数据框架（如Spark/Hadoop）难以高效处理非结构化数据，GPU/DPU等异构计算资源利用率不足；数据处理流程与模型训练脱节，ETL环节耗时长，CPU-GPU协同效率低下，导致算法迭代周期延长。在此背景下，以数据为中心的人工智能（DCAI）与异构计算技术成为破局关键： -DCAI 强调通过数据质量优化与自动化处理链路提升模型性能，而非单纯依赖模型改进； -异构计算通过统一调度CPU、GPU、DPU等资源，加速多模态数据处理与模型训练，实现降本增效。 2、课题目标（1）构建支持多模态数据的低成本高性能存储引擎：支持百亿级用户行为序列与多模态数据混合存储，实现读写延时与存储量解耦，满足PB级数据天级回溯需求；（2）设计自适应数据演化的Schema管理机制：动态兼容特征增删改，确保训推一致性，降低模型迭代中的数据迁移成本；（3）研发多模态数据异构计算框架：实现CPU-GPU-DPU协同计算，加速ETL、特征处理与模型训练，提升资源利用率30%以上；（4）建立数据质量与模型性能的量化评估体系：开发自动化工具链，通过强化学习优化数据清洗、增强与异常检测流程；（5）打造以Python为核心的开发者生态：提供灵活API与可视化工具，支持快速接入多模态数据处理与DCAI优化链路。 3、研究内容（1）多模态存储引擎与编码优化 - 混合存储架构 - 分层设计：行为序列采用时间分区+LSM-Tree存储，多模态数据（如图像/文本）采用对象存储+元数据索引，结合CXL内存池化技术降低访问延迟； - 编码优化：针对用户行为序列设计变长Delta编码，多模态数据采用深度学习压缩模型（如VAE），压缩比提升50%以上。 -Schema动态演化 - 开发基于Protobuf的版本化Schema语言，支持特征字段热更新，兼容历史数据回溯训练。（2）异构计算框架与资源调度 - 计算引擎整合 - 基于Ray构建统一数据湖，实现Spark/GPU算子混合编排，数据从ETL到训练Tensor化零拷贝传输； - 设计DPU加速层，将哈希计算、特征编码等操作卸载至智能网卡，释放CPU/GPU算力。 - 多模态处理优化 - 文本/视频数据采用GPU流水线预处理，利用NVIDIA RAPIDS加速特征提取； - Embedding数据通过量化感知训练（QAT）减少显存占用，支持FP16/INT8混合精度计算。（3）数据质量与DCAI自动化链路 - 质量评估体系 - 定义多维度指标：时空一致性（行为时序异常检测）、模态对齐度（图文匹配校验）、噪声容忍阈值（基于模型鲁棒性反推）。 - 自动化优化工具 - 开发强化学习代理，根据模型反馈自动选择数据清洗策略（如GAN-based数据增强 vs. 规则过滤）； - 构建因果推理模块，定位数据分布偏移对模型AUC下降的贡献度，生成根因分析报告。（4）开发者生态与效能提升 - Python原生接口 - 提供声明式数据处理DSL，支持通过Python装饰器定义GPU加速算子（如@gpu_map）； - 集成Jupyter可视化工具，实时展示数据质量热力图与模型性能关联分析。 - 效能监控体系 - 建立资源-质量-效果三维监控看板，跟踪存储成本、数据处理吞吐量、模型AUC等核心指标。

更新于 2025-03-03上海

推荐特征工程实习生-抖音/直播/电商/剪映-筋斗云人才计划

实习A59413

更新于 2025-03-03北京

研究型实习生 - 面向 AI 的基础设施网络性能与稳定性技术研究

实习阿里云研究型实习

随着人工智能技术的飞速发展，AI 大模型对计算资源的需求日益增长。数据中心作为支撑 AI 运算的基础设施，其网络性能和稳定性直接影响 AI 模型训练的效率和推理准确性。然而，当前的数据中心网络在处理大规模数据传输、高并发请求以及复杂网络拓扑时仍然面临诸多挑战。为此，开发新一代数据中心网络技术意在提升网络传输速度、降低延迟、增强网络的容错以及故障定位等能力，对于推动 AI 技术的进一步发展具有重要意义。本项目意在聚焦于阿里云面向 AI 大模型训练的网络性能和稳定性优化技术，具体解决如下几个关键问题： 1、关于 AI 训练网络中故障的快速响应和定位问题，如何通过建立集合通信 log、上层训练框架代码 log 以及底层网络拓扑信息进行横向关联后进行精准、高校的故障根因定位； 2、AI 大模型训练要求网络能够针对故障快速恢复，恢复过程要保证新设备的热迁移，以及如何选择被迁移设备，保证客户侧无感知 3、关于下一代集合通信以及网卡侧的传输协议设计，针对性的对大模型训练和推理特征设计一套行之有效的优化技术，针对其周期性、突发式带宽的传输协议解决关键的技术挑战交付指标： 1、发表 1-2 篇国际顶级会议论文（如 SIGCOMM/NSDI/OSDI/SOSP） 2、专利 1-2 发明专利 3、能够实际在阿里云生产环境运行的系统（非原型系统），产生实际的结果收益

更新于 2025-02-07北京|杭州