logo of kuaishou

快手【留用实习】系统可观测开发工程师

实习兼职J1014地点:北京状态:招聘

任职要求


1、计算机等相关专业本科及以上学历,熟悉Go/Java/Python等主流编程语言;
2、具备扎实的计算机底层知识,比如操作系统、计算机体系结构;
3、熟悉RedisKafkaMysqlClickhouse等领域常用数据库和中间件;
4、熟悉大数据处理技术,如SparkFlink等;
5、熟悉云原生K8S技术栈;
6、具有良好的沟通能力和团队合作精神、优秀的分析问题和解决问题的能力。

加分项
1、有大数据处理分析经验;
2、在AIOps智能运维方向,包括智能异常检测、时序预测、故障定位等场景有深入的研究或者工程化经验。

工作职责


1、参与快手系统可观测平台的开发建设,提供极致的云原生系统可观测性及分析平台体验;
2、参与快手系统Profiling能力建设;
3、参与AIOps方向的探索与落地,优化干扰检测、根因分析、容量规划等;
4、调研业界系统可观测性方向发展,探索落地业界最佳实践。
包括英文材料
学历+
Go+
Java+
Python+
Redis+
Kafka+
MySQL+
ClickHouse+
中间件+
Spark+
Kubernetes+
相关职位

logo of kuaishou
实习J1020

1、基于快手自研的文生视频(可灵)、文生图(可图)、文生文(快意)等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并于算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。

更新于 2025-05-14
logo of kuaishou
实习J1014

1、参与快手EB级大数据平台分布式计算引擎相关系统的研发与优化工作,解决实际业务需求与性能问题。子系统包括但不限于Hive、Spark,Presto、Flink、Druid、Clickhouse等; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、和开源社区保持交流,从社区引入对公司业务场景有帮助的特性与系统,或将内部研发的功能贡献到社区。

更新于 2025-06-23
logo of kuaishou
实习PM

1、跟进业务需求,跟进IDC数据中心设备设施的供应管理&系统集成交付项目管理,保证供需平衡; 2、对接IT进行需求说明书的制作,流程的绘制等;系统后台数据的管理维护,以及组织系统平台操作指导培训;跟进业务逻辑需求分析,辅助系统的优化升级; 3、跟内外部(含供应商)沟通合同信息并跟进合同签署完成。

更新于 2025-05-26
logo of kuaishou
实习J1020

1.性能分析与优化:使用先进的性能分析工具(如nsys、torch profiler等),对大模型训练引擎进行性能剖析,定位瓶颈并提出优化方案。 2.分布式训练优化:深入研究分布式训练技术,探索并实现高效的并行策略,提升大规模模型训练的速度与效率。 3.代码优化与重构:参与训练引擎代码的优化与重构工作,提升代码质量与运行效率,确保系统的稳定性和可扩展性。 4.前沿技术研究:跟踪大模型训练领域的最新研究成果,复现并集成先进的优化技术,推动训练引擎的性能提升。

更新于 2025-05-19