字节跳动大数据开发工程师(国际化安全业务)-Data
任职要求
1、熟悉数据仓库实施方法论、深入了解数据仓库体系,并支撑过实际业务场景; 2、熟练使用Hadoop及Hive,熟悉SQL、Java、P…
工作职责
1、参与离线与实时数据仓库的构建,支持国际化的安全、风控等业务; 2、深入业务,理解并合理抽象业务需求,并负责落地实施,与业务团队紧密合作,为业务提供数据解决方案; 3、参与数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 4、参与大数据应用规划和支持,为数据产品、挖掘团队提供技术支持; 5、参与数据治理工作,提升数据易用性及数据质量。
Team Introduction: TikTok Content Security Algorithm Research Team The International Content Safety Algorithm Research Team is dedicated to maintaining a safe and trustworthy environment for users of ByteDance's international products. We develop and iterate on machine learning models and information systems to identify risks earlier, respond to incidents faster, and monitor potential threats more effectively. The team also leads the development of foundational large models for products. In the R&D process, we tackle key challenges such as data compliance, model reasoning capability, and multilingual performance optimization. Our goal is to build secure, compliant, and high-performance models that empower various business scenarios across the platform, including content moderation, search, and recommendation. Research Project Background: In recent years, Large Language Models (LLMs) have achieved remarkable progress across various domains of natural language processing (NLP) and artificial intelligence. These models have demonstrated impressive capabilities in tasks such as language generation, question answering, and text translation. However, reasoning remains a key area for further improvement. Current approaches to enhancing reasoning abilities often rely on large amounts of Supervised Fine-Tuning (SFT) data. However, acquiring such high-quality SFT data is expensive and poses a significant barrier to scalable model development and deployment. To address this, OpenAI's o1 series of models have made progress by increasing the length of the Chain-of-Thought (CoT) reasoning process. While this technique has proven effective, how to efficiently scale this approach in practical testing remains an open question. Recent research has explored alternative methods such as Process-based Reward Model (PRM), Reinforcement Learning (RL), and Monte Carlo Tree Search (MCTS) to improve reasoning. However, these approaches still fall short of the general reasoning performance achieved by OpenAI's o1 series of models. Notably, the recent DeepSeek R1 paper suggests that pure RL methods can enable LLM to autonomously develop reasoning skills without relying on the expensive SFT data, revealing the substantial potential of RL in advancing LLM capabilities. 团队介绍: 国际化内容安全算法研究团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,团队同时负责产品基座大模型的研发,我们在研发过程中需要解决数据合规、模型推理能力、多语种性能优化等方面的问题,从而为平台上的内容审核、搜索、推荐等多项业务提供安全合规,性能优越的基座模型。 课题介绍: 课题背景: 近年来,大规模语言模型(Large Language Models, LLM)在自然语言处理和人工智能的各个领域都取得了显著的进展。这些模型展示了强大的能力,例如在生成语言、回答问题、翻译文本等任务上表现优异。然而,LLM 的推理能力仍有很大的提升空间。在现有的研究中,通常依赖于大量的监督微调(Supervised Fine-Tuning, SFT)数据来增强模型的推理性能。然而,高质量 SFT 数据的获取成本高昂,这对模型的开发和应用带来了极大的限制。 为了提升推理能力,OpenAI 的 o1 系列模型通过增加思维链(Chain-of-Thought, CoT)的推理过程长度取得了一定的成功。这种方法虽然有效,但在实际测试时如何高效地进行扩展仍是一个开放的问题。一些研究尝试使用基于过程的奖励模型(Process-based Reward Model, PRM)、强化学习(Reinforcement Learning, RL)以及蒙特卡洛树搜索算法(Monte Carlo Tree Search, MCTS)等方法来解决推理问题,然而这些方法尚未能达到 OpenAI o1 系列模型的通用推理性能水平。最近deepseek r1在论文中提到通过纯强化学习的方法,可以使得 LLM 自主发展推理能力,而无需依赖昂贵的 SFT 数据。这一系列的工作都揭示着强化学习对LLM的巨大潜力。 课题挑战: 1、Reward模型的设计:在强化学习过程中,设计一个合适的reward模型是关键。Reward模型需要准确地反映推理过程的效果,并引导模型逐步提升其推理能力。这不仅要求对不同任务精准设定评估标准,还要确保reward模型能够在训练过程中动态调整,以适应模型性能的变化和提高。 2、稳定的训练过程:在缺乏高质量SFT数据的情况下,如何确保强化学习过程中的稳定训练是一个重大挑战。强化学习过程通常涉及大量的探索和试错,这可能导致训练不稳定甚至模型性能下降。需要开发具有鲁棒性的训练方法,以保证模型在训练过程中的稳定性和效果。 3、如何从数学和代码任务上拓展到自然语言任务上:现有的推理强化方法主要应用在数学和代码这些CoT数据量相对丰富的任务上。然而,自然语言任务的开放性和复杂性更高,如何将成功的RL策略从这些相对简单的任务拓展到自然语言处理任务上,要求对数据处理和RL方法进行深入的研究和创新,以实现跨任务的通用推理能力。 4、推理效率的提升:在保证推理性能的前提下,提升推理效率也是一个重要挑战。推理过程的效率直接影响到模型在实际应用中的可用性和经济性。可以考虑利用知识蒸馏技术,将复杂模型的知识传递给较小的模型,以减少计算资源消耗。另外,使用长思维链(Long Chain-of-Thought, Long-CoT)技术来改进短思维链(Short-CoT)模型,也是一种潜在的方法,以在保证推理质量的同时提升推理速度。
团队介绍:国际电商是以TikTok为载体的电商业务(也称为TikTok Shop),致力于成为用户发现并获取优价好物的首选平台,在直播电商、视频内容电商、货架电商等多场景下,国际电商希望能为用户提供更个性化、更主动、更高效的消费体验,为商家提供稳定可靠的平台服务,致力于新奇好物畅销全球,美好生活触手可得的使命。 Data-电商团队是国际电商的核心算法技术力量,专注于电商领域的算法创新,帮助用户高效发现感兴趣的商品,保障用户的购物安全,提升交易各环节的智能化水平。在这里,你将与一流的产品和技术团队合作、钻研,一起应对技术和业务上的挑战,推动技术在电商场景的深度落地。 1、依托百亿级视频资源和多元的内容电商场景,参与General Multimodal Embedding、Multimodal Large Language Model、Large Scale Multimodal Retrieval、Multimodal Reasoning等技术领域的深耕细作; 2、负责运用计算机视觉、自然语言处理、多模态大模型等前沿技术对视频内容与商品内容进行全面深入的理解与分析; 3、负责运用相关技术,为国际电商内容搜索、推荐场景提供丰富的内容场语义信号,为全球商家、创作者提供优质的智能内容创作和趋势跟踪服务; 4、参与数据到业务落地全流程,包括但不限于数据处理、数据分析、特征工程、算法模型设计、评估、迭代,并持续探索最前沿技术。
团队介绍: 平台技术是阿里国际集团技术创新和业务支撑的核心团队,以构建全球领先的数据+智能+跨云一体化数字化技术基础设施为目标,倾力打造合规、稳定、高效且用户体验卓越的技术服务平台。 我们基于全球化架构与数字智能技术,构建坚实合规的全球化商业底座。采用先进的微服务架构、混合云最佳实践以及智能模块化设计,有效提升业务响应速度和灵活性。通过技术创新驱动研发模式的代际演进,聚焦敏捷开发、先进生产工具、自动化运维流程,践行AI和云原生时代的DevOps文化。打造技术产品和研发规范,构筑起全方位的安全防护屏障。依托数据平台,基于大数据分析、机器学习等先进技术手段,构建强大的数据中台和智能决策支持系统。我们的终端技术专注于提升用户的数字化交互体验,结合智能时代的人机交互范式和网络技术,为全球用户提供极致流畅、个性智能的产品体验 职位描述 1. 产品规划与落地: 负责基于海量电商数据,规划并设计数据智能 Agent 产品(如:商机挖掘,用户洞察,智能取数助手、Text-to-SQL 工具、自动化数据分析报告)。 2. 技术转化与应用: 深入最新AI领域的技术最新在数据分析领域的应用(如 Agent 框架、RAG 检索增强、Text-to-SQL 准确率优化、Code Interpreter 等),将前沿技术转化为可落地的产品功能,解决传统的痛点。 3. 跨部门协作: 与 ETL 工程师、数据分析师、算法团队紧密配合,业务 多部门合作,梳理电商业务“语义层”或“知识库”和工作流程。 4. 场景挖掘与运营: 深入业务一线,挖掘运营、采销、管理层的数据使用场景,推广 AI 数据工具。通过用户行为数据分析,优化 Agent 的交互体验,提升内部或外部客户的数据获取效率。