希音技术专家(Spark方向)
社招全职6年以上信息技术类地点:南京 | 上海状态:招聘
任职要求
1.至少6年以上相关经验,有扎实的计算机编程基础,精通java/scala,熟悉jvm的原理和调优。 2.精通spark/hive/flink组件原理和内核优化,有超大规模数据计算的架构设计和优化经验。 3.掌握大…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.大数据新技术规划、调研、选型及推广落地。 2.负责大数据组件内核开发优化,推进组件容器化,进行组件二次开发与适配等工作。 3.日常负责大数据框架组件的性能优化,稳定性保障,异常监控及线上问题对接解决。 4.参与平台功能研发,提供业务系统化的解决方案。
包括英文材料
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
JVM+
https://www.freecodecamp.org/news/jvm-tutorial-java-virtual-machine-architecture-explained-for-beginners/
https://www.youtube.com/watch?v=e2zmmkc5xI0
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位

社招3年以上技术
1、主导开发风控平台系统整体架构设计、方案设计和代码的落地实现,保证风控系统的稳定性。; 2、开发数据挖掘工具,支持并提速风险与防控方案的数据分析; 3、为特定风控系统或工具的长中短期影响力负责。主导技术路线,定义并满足执行预期。 4、梳理工程质量、操作流程与系统可扩展性上的机会与挑战,推进上下游共同提升平台能力。
更新于 2025-01-07上海

社招技术类
1、负责研发得物搜推主场景样本数据平台,管理样本数据的拼接、加工与存储; 2、负责历史训练样本的管理、特征回补等功能;负责在线流式训练的实时样本系统的研发; 3、搭建一站式的在离线样本特征链路,不断完善架构设计,优化系统的稳定性、性能、可扩展性。
更新于 2024-09-19北京|上海