字节跳动数据分析师(人力系统方向)-集团信息系统
任职要求
1、良好的代码能力,掌握SQL、Python等常用的数据分析工具,能够使用Tableau/PowerBI等工具搭建数据看板; 2、充满好奇心,能够通过已有的经历触类旁通、举一反三; 3、对数字敏感,有洞察力和框架思维,能准确定义问题、提出假设并设计解决方案; 4、优秀的沟通能力和影响他人的能力,能讲好故事; 5、有韧性,以拿结果为最终目标,不设边界。
工作职责
1、深入了解业务场景,结合业务场景建设稳定、可靠的底层数据,确保数据准确、可用; 2、通过数据分析方法识别、预测在组织中的信息效率问题并提出可落地的建议,如如何提升信息传播效率、减少无效信息、解决信息分散问题等,并最终推动拿到管理收益; 3、通过数据挖掘日常管理背后的规律和底层逻辑,建立分析框架和模型。
1. 岗位描述: 1)参与构建人才评价与发展体系,推动数据驱动的人才选拔机制优化 2)运用数据工具/算法,参与人岗匹配策略优化、校招路径建模 3)分析组织人才流动趋势,参与组织效能提升策略的设计与评估 4)与业务团队协作,通过结构化方法推动组织能力建设项目落地 5)支持人力产品的数字化工具搭建、数据仪表盘设计与效果追踪 2. 获得的成长: 1)全景视角理解一个公司是如何运作的,从人才到组织再到业务 2)在跨部门项目中历练沟通协同力,参与战略落地过程 3)未来可向组织战略、人力产品经理、HRBP、数据分析师等多方向发展
团队介绍:推荐架构团队支撑字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、剪映等推荐系统架构的设计和开发,保障系统的稳定和高可用,致力于抽象系统通用组件和服务,建设推荐中台、数据中台;关于在线服务,在这里你有机会参与大规模机器学习在线预估框架的研发与优化,也有机会参与模型训练与调度等相关问题的研究与突破,解决系统瓶颈,降低成本开销;如你对大数据感兴趣,在这里也有机会参与通用实时计算系统的开发、构建统一的推荐特征中台,为推荐业务实现先进的消重、计数、特征服务等;我们期待热爱技术的你加入,一起创造更多可能。 课题介绍: 在人工智能技术高速发展的背景下,推荐系统作为信息过滤与个性化服务的核心,面临多重挑战: 一方面,推荐系统自身的复杂性急剧增加。大量推荐策略不断演进迭代、且系统状态动态变化,但缺乏有效手段自动跟踪评估策略有效性并下线低 ROI 策略,导致系统存在较多低效策略。同时,推荐系统依赖多种基础组件,其复杂负载模型给底层组件参数配置和性能调优带来巨大困难,日常开发迭代中的问题排查等工作消耗大量人力,亟需提升开发效率、降低人力成本。 另一方面,随着电商行业等领域的激烈竞争,传统推荐系统在多样性、创新性和个性化方面的短板愈发凸显,难以满足用户日益增长的多元需求。生成式人工智能技术虽带来新突破,但在实际应用中面临成本效率、全域数据协同、数据隐私与安全以及技术变革应对等诸多难题。 课题内容: 1、策略管理与优化:构建一套智能化系统,实现推荐策略的规范化定义、长期及离线评估、无效策略自动识别与下线,以及相关代码配置的下线; 2、自适应调优与故障诊断:针对推荐系统多样化业务负载,利用大模型能力完成系统及底层组件的参数和配置调优,并探索自适应故障诊断方案,提供全局视角的故障追踪、定位和分析能力; 3、成本与效率平衡:在推荐系统应用生成式技术时,解决模型训练和运行的高成本问题,平衡成本与效率,在有限资源下实现高效推荐; 4、全域数据处理:应对电商等横向全域场景下海量异构数据,提升和保障数据质量与准确性,标准化供给数据给全域推荐模型,并实现低成本跨端服务,同时,确保数据隐私与安全,合规使用数据; 5、多模态数据表征和 RAG 应用系统:应对推荐、检索、问答、创作场景的多模态数据需求,提供数据理解、预处理、索引、召回环节的完整解决方案,提供知识、记忆服务能力,并针对各类大小模型负载进行系统优化,最大化信息处理效率和精度。
团队介绍:推荐架构团队支撑字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、剪映等推荐系统架构的设计和开发,保障系统的稳定和高可用,致力于抽象系统通用组件和服务,建设推荐中台、数据中台;关于在线服务,在这里你有机会参与大规模机器学习在线预估框架的研发与优化,也有机会参与模型训练与调度等相关问题的研究与突破,解决系统瓶颈,降低成本开销;如你对大数据感兴趣,在这里也有机会参与通用实时计算系统的开发、构建统一的推荐特征中台,为推荐业务实现先进的消重、计数、特征服务等;我们期待热爱技术的你加入,一起创造更多可能。 课题介绍: 在人工智能技术高速发展的背景下,推荐系统作为信息过滤与个性化服务的核心,面临多重挑战: 一方面,推荐系统自身的复杂性急剧增加。大量推荐策略不断演进迭代、且系统状态动态变化,但缺乏有效手段自动跟踪评估策略有效性并下线低 ROI 策略,导致系统存在较多低效策略。同时,推荐系统依赖多种基础组件,其复杂负载模型给底层组件参数配置和性能调优带来巨大困难,日常开发迭代中的问题排查等工作消耗大量人力,亟需提升开发效率、降低人力成本。 另一方面,随着电商行业等领域的激烈竞争,传统推荐系统在多样性、创新性和个性化方面的短板愈发凸显,难以满足用户日益增长的多元需求。生成式人工智能技术虽带来新突破,但在实际应用中面临成本效率、全域数据协同、数据隐私与安全以及技术变革应对等诸多难题。 课题内容: 1、策略管理与优化:构建一套智能化系统,实现推荐策略的规范化定义、长期及离线评估、无效策略自动识别与下线,以及相关代码配置的下线; 2、自适应调优与故障诊断:针对推荐系统多样化业务负载,利用大模型能力完成系统及底层组件的参数和配置调优,并探索自适应故障诊断方案,提供全局视角的故障追踪、定位和分析能力; 3、成本与效率平衡:在推荐系统应用生成式技术时,解决模型训练和运行的高成本问题,平衡成本与效率,在有限资源下实现高效推荐; 4、全域数据处理:应对电商等横向全域场景下海量异构数据,提升和保障数据质量与准确性,标准化供给数据给全域推荐模型,并实现低成本跨端服务,同时,确保数据隐私与安全,合规使用数据; 5、多模态数据表征和 RAG 应用系统:应对推荐、检索、问答、创作场景的多模态数据需求,提供数据理解、预处理、索引、召回环节的完整解决方案,提供知识、记忆服务能力,并针对各类大小模型负载进行系统优化,最大化信息处理效率和精度。
Team Introduction: The ByteDance Recommendation Architecture Team is responsible for the design and development of the recommendation system architecture for ByteDance's related products. It ensures the stability and high availability of the system, optimizes the performance of online services and offline data streams, resolves system bottlenecks, and reduces cost overheads. The team also abstracts the common components and services of the system, builds the recommendation middle - office and data middle - office to support the rapid incubation of new products and enable ToB services. 团队介绍: 字节跳动推荐架构团队,负责字节跳动旗下相关产品的推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能。 课题背景: 在当今数字化时代,推荐系统已成为众多领域(如电商、信息资讯等)实现个性化服务、提升用户体验和竞争力的关键技术。然而,随着技术的不断发展和业务场景的日益复杂,推荐系统面临着诸多严峻挑战。 一方面,推荐系统自身的复杂性急剧增加。大量推荐策略不断演进迭代,且系统状态动态变化,但缺乏有效手段自动跟踪评估策略有效性并下线低 ROI 策略,导致系统存在较多低效策略。同时,推荐系统依赖多种基础组件,其复杂负载模型给底层组件参数配置和性能调优带来巨大困难,日常开发迭代中的问题排查等工作消耗大量人力,亟需提升开发效率、降低人力成本。 另一方面,随着电商行业等领域的激烈竞争,传统推荐系统在多样性、创新性和个性化方面的短板愈发凸显,难以满足用户日益增长的多元需求。生成式人工智能技术虽带来新突破,但在实际应用中面临成本效率、全域数据协同、数据隐私与安全以及技术变革应对等诸多难题。 此外,随着大模型的快速发展,推荐系统对用户行为序列数据的存储和质量要求不断提高,数据质量对模型性能的影响愈发关键。同时,模型规模的扩大和多模态数据的涌现,使得推荐系统在数据处理环节面临冗长、资源利用不合理以及传统数据处理框架难以满足多模态数据处理需求等问题。 课题挑战: 策略管理与优化:构建一套智能化系统,实现推荐策略的规范化定义、长期及离线评估、无效策略自动识别与下线,以及相关代码配置的下线。 自适应调优与故障诊断:针对推荐系统多样化业务负载,利用大模型能力完成系统及底层组件的参数和配置调优,并探索自适应故障诊断方案,提供全局视角的故障追踪、定位和分析能力。 成本与效率平衡:在推荐系统应用生成式技术时,解决模型训练和运行的高成本问题,平衡成本与效率,在有限资源下实现高效推荐。 全域数据处理:应对电商等横向全域场景下海量异构数据,提升和保障数据质量与准确性,标准化供给数据给全域推荐模型,并实现低成本跨端服务,同时,确保数据隐私与安全,合规使用数据。 数据存储与质量提升:研发低成本高性能存储引擎,设计灵活的Schema Evolution机制,实现数据高并发实时写入与训推一致性,深入探究数据质量与模型预测性能的量化关系,构建基于DCAI理念的数据和模型相关性分析工具及训练数据自动化处理链路。 多模态数据与异构计算:构建适用于推荐系统的多模态数据异构计算处理框架,解决数据读取、框架整合、高性能算子编排等问题,提高数据处理和模型训练效率,建立以Python为核心的开发者生态。 推荐大算力模型效率优化:随着大模型在CV/NLP/多模态以至于AGI领域的不断突破,推荐场景下的大算力驱动能够帮助模型更全面深刻理解用户偏好,进而更好地理解用户需求,挖掘用户潜在兴趣,进而带来更好地用户体验。更大规模的推荐模型需要更大的算力,如何平衡好算力开销和效果收益,需要架构和算法工程师深度Co-Design。