飞猪旅行飞猪-高级数据开发工程师-大模型&搜推广&数仓
社招全职3年以上地点:杭州状态:招聘
任职要求
1.统计、数学、计算机,大数据相关专业优先,至少3年以上数仓/数据开发工作经验; 2.熟悉Hadoop/Flink/Spark等大数据体系,具备…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责飞猪搜推广及营销等多个场景的数据建设工作,包括特征工程、中间层建设、分析监控等,与产品、工程、算法团队紧密合作,建设可靠、科学的数据体系。 2.负责飞猪AI项目数据资产建设,包括大模型日志数据、知识数据、训练数据、评测数据等; 3.负责实时/离线数据成本治理及数据质量保障工作。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招3年以上
1.负责飞猪搜索、推荐、广告等多个业务场景的数据建设工作,包括特征工程、中间层建设、数据分析洞察等工作; 2.负责飞猪AI项目数据资产建设,包括大模型日志数据、知识数据、训练(SFT/PreTrain)等; 3.负责数据成本及稳定性相关工作
更新于 2026-01-06杭州
社招5年以上信息技术类
1、主要负责大数据可视化平台核心功能开发; 2、负责产品的性能优化,让产品拥有更优质的用户体验,熟悉浏览器运行机制,熟悉nodejs; 3、解决小组成员遇到的问题,负责小组成员日常代码review。
更新于 2025-10-11广州|南京|深圳
社招3年以上核心本地商业-基
1、负责酒旅业务数据仓库体系建设,业务数据建模,数据应用产品的研发及管理工作; 2、负责数据仓库ETL流程设计、开发和优化,解决提升数仓体系生产效率与治理能力; 3、负责数据仓库OLAP体系搭建,建设海量数据高效、灵活的在线分析应用; 4、负责实时数仓的建设,使用系统化建设的思维提升实时研发效率,降低生产运维成本 5、深入理解业务需求,与业务团队紧密合作,提供技术支持和解决方案,持续优化数据处理流程。
更新于 2025-08-09北京
社招3年以上技术类-数据
1.负责蚂蚁财富、保险业务线数据体系和解决方案建设,赋能业务数字化运营,提升运营效率,保障数据的质量和稳定性; 2.负责业务领域核心数据体系的规划,以数据为核心生产要素制定数据解决方案,解决业务开展过程中遇到的痛点,包括但不限于用户标签体系、数据智能化和自动化体系和实时数据体系的建设; 3.负责建设高质量的领域数据资产,包括但不限于外部数据引入、数据标注、特征挖掘等,为业务智能化营销、大模型等智能化场景,提供必要的模型训练、迭代、部署等方面的支持,确保业务智能化升级目标能够顺利推进、落地; 4.负责主导或参与数据治理工作,实现持续、低成本的产出高质量的数据;建设数据内部共享融通的数据平台,保障数据的合规使用,避免数据泄漏及违规使用。
更新于 2025-09-01上海|杭州