字节跳动AI数据运营专家-大模型数据服务中心
任职要求
1、本科及以上,计算机、人工智能及软件工程专业有结合的相关专业、具备1-3年人工智能相关领域经验优先; 2、精通Python编程,具备强烈的代码规范意识,追求代码的整洁、可读性与可维护性; 3、拥有丰富的Git/GitHub协作开发经验,熟悉标准的团队工作流(如Forking、Feature Bran…
工作职责
1、负责部分训练数据清洗、预处理管道的维护工作,为模型训练奠定基础; 2、编写高质量、模块化、可测试的Python代码,并严格遵循代码规范; 3、负责实现并维护大模型评测过程中的评估指标(如各种自定义评估任务); 4、参与日常尺度拉齐、执行监督纠偏等工作,对技术方案落地负责; 5、扎实的线上问题排查能力,擅长阅读和分析复杂的系统/应用日志,能够快速从报错信息中定位到核心问题。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、负责规模化运营外包专家团队,制定和优化人工评估流程和标准,对专家评估结果进行质量把控,进行数据分析,撰写评估报告,为模型优化提供可靠依据; 2、搭建自动评估和标注体系,编写PE和Workflow程序,实现评估数据的规模生成与筛选,协同产品研发团队完成自动评估系统搭建与优化; 3、制作自动评估的评测集,从多样性、时效性、真实性、区分度等维度,保障评测集的质量,辅助研发快速迭代。
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。
1. 百炼移动端 & 应用广场设计: (1)设计百炼移动端 & 应用广场核心功能:模板体验、用户路径,搜索推荐、应用部署对接流程等,基于场景、行业理解设计高质量的模板分类、标签体系,降低企业及开发者使用门槛。 (2)制定应用上架标准与审核机制(包括功能、安全合规、效果基线、发布流程等),建立应用质量分级体系(如官方认证/开发者自营),建立数据反馈体系。 (3)设计AI体验中心,基于应用广场的供给,提供一站式大模型服务与应用体验中心,通过合理的动线设计,提高新用户转化率。 2. 应用开发者生态建设与运营: (1)协同运营团队,设计开发者增长策略(如黑客松赛事、流量扶持计划、分成激励机制),解决应用分发闭环问题,吸引优质大模型应用入驻。 (2)构建开发者支持能力(文档/教程/沙盒环境/版本管理/收益体系),提升应用开发效率与上架转化率。 (3)设计应用商店商业模式,平衡开发者收益与平台成本,设计合理的治理规则,确保应用商店有序发展,构建开发者生态,提高活跃度。 3. 应用生态价值挖掘: (1)分析应用调用、付费、运营数据,挖掘高潜力应用方向,反向驱动平台开发能力迭代,将头部应用打包为行业标准化产品。 (2)配合运营建设高质量一方应用,呈现大模型服务及应用的能力及场景,丰富市场供给。 4. 行业洞察与竞争分析: (1)跟踪国内外多模态交互类产品动态,制定技术对标与差异化方案。