字节跳动大数据开发工程师-国际化生活服务
任职要求
1、熟悉数据仓库实施方法论、深入了解数据仓库体系,并支撑过实际业务场景; 2、熟练使用Hadoop及Hive,熟悉SQL、Java、Python等编程语言; 3、善于沟通,对业务敏感,能快速理解业务背景,具备优秀的技术与业务结合能力; 4、英语可以作为工作语言是加分项。
工作职责
1、参与离线与实时数据仓库的构建,支持国际化本地生活业务的发展; 2、深入业务,理解并合理抽象业务需求,并负责落地实施,与业务团队紧密合作,为业务提供数据解决方案; 3、参与数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 4、参与大数据应用规划和支持,为数据产品、挖掘团队提供技术支持; 5、参与数据治理工作,提升数据易用性及数据质量。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、构建全面的隐私数据质量挖掘及隐私质量的度量指标体系、沉淀隐私数据质量分析方法与监控框架, 提炼隐私数据产品需求,与相关团队(质量,数据平台引擎,数据平台化开发等) 协作完成隐私风险监控的体系搭建; 2、参与大数据组件技术应用,国际化短视频数据保护的质量建设、改造和技术攻关; 3、工作范围涉及包括但不限于:任务和资源调度系统,分布式高并发系统,据资产管理,实时质量监控,流批一体技术等领域。
团队介绍: 字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。
团队介绍: 字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。
加入西门子智能基础设施集团智能建筑事业部,成为零碳先锋,共创明日世界! 西门子智能基础设施集团 (Siemens Smart Infrastructure, SI) 的业务涵盖能源系统、楼宇和工业,旨在通过集成软硬件、产品、系统和解决方案,改善人们的生活和工作方式,显著提高效率和可持续性。我们致力于打造更低碳、更智能、更灵活的基础设施,在楼宇科技、智慧园区、数据中心等领域,都有我们成功的项目案例。 我们期待应用开发工程师(全栈)人才加入我们,一同推动业务发展。 你将在这些领域发挥影响: • 负责公司工业用 AI 产品的全栈开发,涵盖前端页面设计与实现、后端业务逻辑开发及数据库架构设计,确保产品功能完整且满足工业场景需求。 • 深入理解产品需求(如楼宇设备 AI 监控、能耗智能分析、故障预警等),将需求转化为技术方案,独立完成前端交互逻辑、后端接口及数据库层的设计与编码。 • 前端方面:基于 UI/UX 设计稿开发响应式页面,实现设备状态实时展示、AI 分析结果可视化(图表、数据看板等)、用户操作交互等功能,保障在工业控制终端、PC 端等多设备的兼容性与流畅性。 • 后端方面:设计并开发高效、可靠的 API 接口,处理数据采集、AI 模型调用、业务规则计算等核心逻辑,确保与前端及硬件设备的数据交互稳定。 • 数据库方面:负责数据模型设计、表结构优化、查询性能调优,保障工业场景下海量设备数据(如传感器实时数据、历史运行记录)的存储、检索与安全性。 • 与 AI 算法团队、硬件研发团队、产品经理紧密协作,参与需求评审与技术方案讨论,解决跨团队协作中的技术衔接问题(如 AI 模型输出与业务系统集成、硬件数据协议适配)。 • 负责代码质量管控,编写技术文档(如接口文档、数据库设计文档),参与单元测试与系统测试,排查并修复线上问题,持续优化产品性能与稳定性。 • 跟踪工业软件、前端后端技术及数据库领域的发展趋势,将合适的技术与方法论引入项目,提升开发效率与产品竞争力。