logo of kuaishou

快手Java开发实习生-【质量与效能方向】

实习兼职D7628地点:北京状态:招聘

任职要求


1、计算机科学或其他相关专业,本科及以上学历,每周至少4天,连续实习3个月以上; 
2、精通JAVA语言,web开发,多线程编程,熟悉JVM,熟悉常见的开源分布式中间件.缓存.消息队列等,有分布式系统设计相关经验,熟悉MySQL;
3、精通Spring boot编程;
4、熟悉面向对象设计,有一定的模块设计能力。

工作职责


1、参与快手电商质量工具开发,如链路诊断、变更分析、风险巡检等业务。深入理解业务需求,撰写技术方案和系统设计,并完成相关代码的开发工作;
2、接受由JVM底层指令的复杂性、大数据处理、服务高可用带来的挑战,推动系统可用性和可扩展性的提升;
3、有一定的产品交互思维,能够为用户思考高效简洁的交互方案,确保极好的交互体验;
4、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。
包括英文材料
学历+
Java+
Web+
多线程+
JVM+
中间件+
缓存+
消息队列+
分布式系统+
MySQL+
Spring Boot+
面向对象+
相关职位

logo of bytedance
实习A35767

ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 1、面向电商、财经、今日头条、飞书等20+业务线,提供自动化能力基建及解决方案,包括低代码自动化、流量回放、测试充分度; 2、结合AI、LLM技术构建新一代测试自动化体系,包括测试IDE、测试生成、智能遍历、缺陷预测等方向; 3、承担各类LLM Agent、自动化工具、研效工具的工程设计及实现。

更新于 2024-07-05
logo of bytedance
实习A160496A

ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 1、面向电商、财经、今日头条、飞书等20+业务线,提供自动化能力基建及解决方案,包括低代码自动化、流量回放、测试充分度; 2、结合AI、LLM技术构建新一代测试自动化体系,包括测试IDE、测试生成、智能遍历、缺陷预测等方向; 3、承担各类LLM Agent、自动化工具、研效工具的工程设计及实现。

更新于 2024-07-05
logo of bytedance
实习A38869

ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 1、面向电商、财经、今日头条、飞书等20+业务线,提供自动化能力基建及解决方案,包括低代码自动化、流量回放、测试充分度; 2、结合AI、LLM技术构建新一代测试自动化体系,包括测试IDE、测试生成、智能遍历、缺陷预测等方向; 3、承担各类LLM Agent、自动化工具、研效工具的工程设计及实现。

更新于 2024-07-05
logo of bytedance
实习A73923

团队介绍:字节跳动推荐架构团队,负责字节跳动旗下相关产品的推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能。 课题介绍: 1、课题背景 在人工智能技术高速发展的背景下,推荐系统作为信息过滤与个性化服务的核心,面临多重挑战: (1)数据爆炸与模型复杂化 用户行为序列数据量呈指数级增长(百亿至千亿级/日),存储需求从单用户长序列扩展至多模态数据(文本、视频、Embedding等),传统存储架构面临读写性能瓶颈与成本压力;推荐大模型对数据质量敏感度提升,数据分布异常可能导致模型效果显著下降,亟需系统性数据质量评估与改进方法。 (2)异构计算与多模态处理需求 随着生成式AI(GenAI)的普及,多模态特征处理成为刚需,传统基于CPU的大数据框架(如Spark/Hadoop)难以高效处理非结构化数据,GPU/DPU等异构计算资源利用率不足;数据处理流程与模型训练脱节,ETL环节耗时长,CPU-GPU协同效率低下,导致算法迭代周期延长。 在此背景下,以数据为中心的人工智能(DCAI)与异构计算技术成为破局关键: -DCAI 强调通过数据质量优化与自动化处理链路提升模型性能,而非单纯依赖模型改进; -异构计算 通过统一调度CPU、GPU、DPU等资源,加速多模态数据处理与模型训练,实现降本增效。 2、课题目标 (1)构建支持多模态数据的低成本高性能存储引擎:支持百亿级用户行为序列与多模态数据混合存储,实现读写延时与存储量解耦,满足PB级数据天级回溯需求; (2)设计自适应数据演化的Schema管理机制:动态兼容特征增删改,确保训推一致性,降低模型迭代中的数据迁移成本; (3)研发多模态数据异构计算框架:实现CPU-GPU-DPU协同计算,加速ETL、特征处理与模型训练,提升资源利用率30%以上; (4)建立数据质量与模型性能的量化评估体系:开发自动化工具链,通过强化学习优化数据清洗、增强与异常检测流程; (5)打造以Python为核心的开发者生态:提供灵活API与可视化工具,支持快速接入多模态数据处理与DCAI优化链路。 3、研究内容 (1)多模态存储引擎与编码优化 - 混合存储架构 - 分层设计:行为序列采用时间分区+LSM-Tree存储,多模态数据(如图像/文本)采用对象存储+元数据索引,结合CXL内存池化技术降低访问延迟; - 编码优化:针对用户行为序列设计变长Delta编码,多模态数据采用深度学习压缩模型(如VAE),压缩比提升50%以上。 -Schema动态演化 - 开发基于Protobuf的版本化Schema语言,支持特征字段热更新,兼容历史数据回溯训练。 (2)异构计算框架与资源调度 - 计算引擎整合 - 基于Ray构建统一数据湖,实现Spark/GPU算子混合编排,数据从ETL到训练Tensor化零拷贝传输; - 设计DPU加速层,将哈希计算、特征编码等操作卸载至智能网卡,释放CPU/GPU算力。 - 多模态处理优化 - 文本/视频数据采用GPU流水线预处理,利用NVIDIA RAPIDS加速特征提取; - Embedding数据通过量化感知训练(QAT) 减少显存占用,支持FP16/INT8混合精度计算。 (3)数据质量与DCAI自动化链路 - 质量评估体系 - 定义多维度指标:时空一致性(行为时序异常检测)、模态对齐度(图文匹配校验)、噪声容忍阈值(基于模型鲁棒性反推)。 - 自动化优化工具 - 开发强化学习代理,根据模型反馈自动选择数据清洗策略(如GAN-based数据增强 vs. 规则过滤); - 构建因果推理模块,定位数据分布偏移对模型AUC下降的贡献度,生成根因分析报告。 (4)开发者生态与效能提升 - Python原生接口 - 提供声明式数据处理DSL,支持通过Python装饰器定义GPU加速算子(如@gpu_map); - 集成Jupyter可视化工具,实时展示数据质量热力图与模型性能关联分析。 - 效能监控体系 - 建立资源-质量-效果三维监控看板,跟踪存储成本、数据处理吞吐量、模型AUC等核心指标。

更新于 2025-03-03