荣耀AI数据开发工程师
任职要求
1. 至少3年以上的数据研发经验,对数据处理、数据建模、数据分析等有深刻认识和实战经验; 2. 有扎实的SQL功底和调优能力,有Java或者Python语言的编程能力; 3. 熟悉大数据存储和计算引擎生态栈,熟悉Hadoop,Flink,Kafka,Spark等相关组件…
工作职责
1. 负责数据研发工作,针对业务诉求和实际数据情况,设计、开发和维护数据处理流程,确保数据的准确性、完整性和一致性; 2. 参与数据系统建设和构建数据应用,包括数据提取、数据分析、模型设计及架构优化工作; 3. 设计和管理数据存储结构,包括数据仓库、数据湖等,优化数据的存储和查询性能; 4. 跟踪和应用最新的数据技术和工具,持续提升数据处理效率。
1、负责智能创作AI平台大模型规模化训练数据自动化处理全流程相关开发工作,包括但不限于数据搜集、预处理、打标、入库、检索等; 2、负责构建针对不同场景、不同数据类型、不同数据规模有足够的扩展性的数据处理技术链路和框架建设,以支撑大模型数据集持续高效迭代,实现高质量数据集沉淀; 3、负责数据生成和数据增强,利用大模型工具生成来扩充和完善数据集。
字节跳动ByteDance Research致力于人工智能领域的前沿技术研究,涵盖自然语言处理、计算机视觉、机器学习、机器人、AI for Science、Responsible AI等多个领域,同时将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、为视频生成模型训练生产高质量的训练数据; 2、负责/参与搭建数据生产工作流,并能够持续提升数据生产的效率、稳定性和易用性; 3、与算法工程师密切配合,理解视频生成模型研发流程,负责/参与模型生成中数据解决方案的设计、开发和维护;同时能够探索业界前沿的多模态数据处理相关技术,并应用到数据生产中。
1. 参与 AI Agent 服务层的整体架构设计与落地,建设智能数据高效流转,包括数据接入、清洗、标注、元数据与血缘增强、数据治理、数据安全。 2. 面向大模型与Agent,设计并实现核心服务层组件,负责Agent场景的效果优化,深入研究LLM后训练相关技术,包括CPT/SFT/RLHF/RLVR等,提高算法准确率和效率。 3. 构建可复用的 Agent 框架与组件库(记忆模块、工具箱、调度器等),实现不同任务的快速拼接、部署与生产落地。 4. 跟踪LLM领域的最新研究成果,用以持续提升算法应用效果,研究方向包括但不限于强化学习中的奖励模型的优化和创新,AgentRL,可验证奖励的构建和扩充。 5. 关注前沿 AI 技术在 Agent 场景的落地可用性,推动试点、验证与落地。