百度用户画像挖掘/数据研发工程师(J84301)
社招全职2年以上MEG地点:北京状态:招聘
任职要求
-计算机相关专业本科及以上学历,2年以上工作经验 -掌握大数据开发技术(Hadoop/Spark/Flink),熟悉机器学习、深度学习技术,熟悉NLP、搜索推荐、L…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-深入挖掘IDM打通、位置属性、App属性、社会属性等,助力信息流、商业、搜索、AI等提高业务效果. -利用机器学习、深度学习等技术,挖掘百度海量的用户行为数据与内容,优化标签质量,建立领先的用户画像 -围绕百度产品需求与痛点,与各团队协作推动画像能力的有效落地应用,促进业绩增长 -搭建画像服务应用平台,提供完善的画像产品与服务
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••
相关职位
社招1年以上D6225
1、整合快手全域海量异构数据,建设公司级核心资产,包括但不限于统一ID服务、时空资产和用户画像; 2、参与核心资产研发体系建设,比如架构设计、数仓建设和数据治理; 3、技术攻坚,解决海量数据下的复杂技术问题,比如关系挖掘、图挖掘中的工程问题; 4、深入业务场景,了解业务痛点,为各业务线提供数据驱动的解决方案。
更新于 2024-08-28北京
社招3年以上信息技术类
本职位需要对数据安全、风险缓解技术、和研发工程,有深入的技术理解和丰富的实践经验,通过数据工程的研发、集成和实施, 构建风险监测模型, 搭建数据安全风险运营平台,量化展示风险和推动决策。应熟悉软件工程行业标准和最佳实践,具备数据开发、数据分析、策略/算法落地的工程能力。 - 领导数据防泄漏、用户异常行为检测的的策略/算法开发实施全方位工作。负责技术调研、系统设计、策略/算法开发、维护迭代、和商业系统集成等,以监控和保护企业敏感数据。 - 应用机器学习、数据挖掘、统计建模等方法进行用户实体行为分析(UEBA), 建立用户画像, 挖掘潜在数据泄漏风险并解决数据安全问题。 - 跨地区跨团队合作, 根据数据安全合规和风险管理要求,提供可视化和可量化的安全运营数据支持,满足公司业务的数据安全需求,保护公司和客户数据。 技能和
更新于 2025-05-14南京
社招1-5年技术类
1、负责搜索推荐服务数据体系的研发设计和建设,通过数据产品和数据服务等方式,赋能商家、运营的业务增长; 2、负责搜索推荐服务的数据建设、数据服务化的设计、开发、性能优化,为上层分析和挖掘提供可靠、统一的离线+实时数据服务; 3、负责搜索推荐场景的用户画像、正倒排索引开发; 4、负责搜索推荐系统的实时监控大盘、实验指标监控、数据质量监控等功能的开发。
更新于 2026-01-14上海