logo of kuaishou

快手数据挖掘/算法工程师(核心资产)-【数据平台】

社招全职1-3年J0012地点:北京状态:招聘

任职要求


1、具备机器学习或者数据挖掘的研究和项目背景;熟练掌握分类、回归、聚类等机器学习模型,能够把业务问题拆解成适合的数据、算法问题,并完成价值落地; 
2、扎实的编程基础,精通至少一门编程语言; 有大数据计算、分布式算法开发经验; 
3、好奇心,有良好的的数据和业务…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、整合海量多维数据,进行全站数据挖掘,构建用户画像体系、时空知识体系,并搭建全站核心数据资产管理平台;
2、深入业务场景,利用全站海量多维数据,综合运用统计和数据挖掘/机器学习的方法,探索平台新的业务增长点,为各类业务系统提供特征和模型支撑; 
3、深度参与归因分析、异常检测、知识图谱等专题类建设工作。
包括英文材料
机器学习+
数据挖掘+
算法+
大数据+
学历+
数据分析+
还有更多 •••
相关职位

logo of aliyun
社招1年以上云智能集团

1. 全模态数据流水线与架构建设:参与万亿级、EB级海量多模态数据(涵盖多语言文本、图像、音频、视频及 Agent 行为数据等)的采集、存储、清洗与加工。设计并实现高效率、高质量的全模态流程编排引擎及核心处理算子(Pipeline),保障海量异构数据的规模化流转与高扩展性。 2. 全模态数据自动化标注:能够结合深度学习与多模态大模型技术,研发并落地智能化的数据处理策略。利用算法模型进行跨模态特征提取与对齐、低质量噪声数据过滤、复杂场景下的异常数据拦截与高价值数据挖掘,大幅提升数据处理的自动化水平与数据质量。 3. 多模态数据对齐、评估与合成:主导大规模“图-文”、“视-文”、“音-文”等多模态对齐数据的规模化生产,尤其是在稀缺数据领域,探索并落地智能标注与前沿的数据合成(Data Synthesis)技术。与算法团队紧密合作,深度参与多模态大模型SFT及对齐阶段的高质量数据集构建、配比调优与评测,并通过评测结果反向持续优化语料质量。 4. 数据资产化与科学分析:主导AI应用的全流程数据仓库与数据分析研发工作,包括数据同步、数据建模、数据计算、数据挖掘分析与数据可视化;构建高扩展性、高一致性、高业务价值的AI应用核心数据资产体系,确保指标准确、及时与可追溯 5. 关注数据处理领域的新技术、新工具和新方法,积极参与技术分享和团队内部培训,推动团队的技术升级和创新。

更新于 2026-04-08杭州
logo of aligenie
社招1年以上

1. 全模态数据流水线与架构建设:参与万亿级、EB级海量多模态数据(涵盖多语言文本、图像、音频、视频及 Agent 行为数据等)的采集、存储、清洗与加工。设计并实现高效率、高质量的全模态流程编排引擎及核心处理算子(Pipeline),保障海量异构数据的规模化流转与高扩展性。 2. 全模态数据自动化标注:能够结合深度学习与多模态大模型技术,研发并落地智能化的数据处理策略。利用算法模型进行跨模态特征提取与对齐、低质量噪声数据过滤、复杂场景下的异常数据拦截与高价值数据挖掘,大幅提升数据处理的自动化水平与数据质量。 3. 多模态数据对齐、评估与合成:主导大规模“图-文”、“视-文”、“音-文”等多模态对齐数据的规模化生产,尤其是在稀缺数据领域,探索并落地智能标注与前沿的数据合成(Data Synthesis)技术。与算法团队紧密合作,深度参与多模态大模型SFT及对齐阶段的高质量数据集构建、配比调优与评测,并通过评测结果反向持续优化语料质量。 4. 数据资产化与科学分析:主导AI应用的全流程数据仓库与数据分析研发工作,包括数据同步、数据建模、数据计算、数据挖掘分析与数据可视化;构建高扩展性、高一致性、高业务价值的AI应用核心数据资产体系,确保指标准确、及时与可追溯 5. 关注数据处理领域的新技术、新工具和新方法,积极参与技术分享和团队内部培训,推动团队的技术升级和创新。

更新于 2026-04-08杭州
logo of amap
社招5年以上技术类-数据

1、加入高德地图的商业智能BI团队,深入理解高德核心业务,为决策层评估业务价值、进行业务决策等提供数据支撑; 2、数据研发:参与高德地图打车、搜索等核心业务的数据仓库、数据产品建设,参与数据治理并沉淀业务数据资产; 3、数据挖掘:基于高德地图的海量日志,通过算法模型挖掘有价值的业务信息,指导高德地图的产品迭代。

更新于 2025-07-31北京
logo of amap
社招5年以上技术类-数据

1、加入高德地图的商业智能BI团队,深入理解高德核心业务,为决策层评估业务价值、进行业务决策等提供数据支撑; 2、数据研发:参与高德地图打车、搜索等核心业务的数据仓库、数据产品建设,参与数据治理并沉淀业务数据资产; 3、数据挖掘:基于高德地图的海量日志,通过算法模型挖掘有价值的业务信息,指导高德地图的产品迭代。

更新于 2025-12-16北京