快手用户画像算法实习生
实习兼职D4013地点:北京状态:招聘
任职要求
1、硕士及以上学历,具备扎实的数学和数据挖掘功底,以及坚实的文本挖掘和机器学习理论基础; 2、了解Hadoop/MapReduce/Spark/Hive等常用大数据处理工具优先; 3、熟练掌握至少一种编程语言GO/Java/C++/Scala/Python,熟悉Linux系统及常用Sh…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、通过对用户行为数据的挖掘,对用户进行建模,精准刻画用户各属性; 2、承担用户画像算法的研发,优化画像模型效果,包含建模、特征优化、模型优化等; 3、对用户长期兴趣进行建模,参与视频推荐优化; 4、分析和研究数据与实际业务,针对具体业务场景,挖掘各类人群标签,对用户进行分级建设,深入理解用户。
包括英文材料
学历+
数据挖掘+
https://www.youtube.com/watch?v=-bSkREem8dM
Database vs Data Warehouse vs Data Lake
https://www.youtube.com/watch?v=7rs0i-9nOjo
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
MapReduce+
https://www.youtube.com/watch?v=bcjSe0xCHbE
https://www.youtube.com/watch?v=cHGaQz0E7AU
In this video I explain the basics of Map Reduce model, an important concept for any software engineer to be aware of.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
实习技术类
1基于滴滴交通出行业务,构建完整的打车智能化运营策略解决方案,包括但不限于增长策略、定价策略、供需预测、资源分配策略等各类丰富场景; 2.利用因果推断、运筹规划、机器学习等技术,提升供需预测、补贴定价等运营核心算法效果 3.综合利用广告投放、推荐、裂变增长、用户画像等算法技术,实现业务线用户的高效增长,优化流量运营效率
更新于 2025-01-17北京
实习策略算法
1、协助负责个性化推荐业务召回、排序等算法研发; 2、协助负责用户增长各环节的算法策略研发,通过算法策略优化提升个性化触达、外投广告、个性化内容分发、用户画像等效果; 3、协助负责用户拉新算法优化、拉新效果分析、拉活流量渠道分析等工作; 4、协助负责用户感知触达等相关算法工作;
更新于 2025-09-04北京
实习技术类
工作内容: 深入参与构建大模型 Agent 高质量数据合成飞轮,构建多维度自动评估体系链路闭环。 具体工作: 1.针对业务场景设计基于LLM大模型的多轮对话数据合成链路,构建高质量数据合成pipeline以及线上自进化数据飞轮。 2.基于业务场景抽象用户画像,设计可插拔的画像策略,实现支持多轮对话策略的自动交互,兼顾可控性与多样性。 3.参与设计建设自动化评估,实时监控数据质量与模型效果。
更新于 2025-08-04北京
