logo of bytedance

字节跳动大模型数据交付专家(内容治理)-DMC

社招全职2年以上A102473B地点:重庆状态:招聘

任职要求


1、本科及以上学历,2年以上互联网内容产品或者大模型经验;
2、具备良好的逻辑能力及数据技能/数据分析能力,熟悉SQL,计算机/统计学专业优先;
3、有良好的内容意识,有同理心,能够站在创作者的角度思考问题;
4、团队协作与沟通能力强,自驱力突出,对大模型有热情,能够积极主动发现问题和解决问题。

工作职责


1、承接来自抖音生态产品的数据需求,按照需求完成数据交付,提升模型准召;
2、支持抖音生态内容机审模型策略相关工作,通过数据标注、分析、挖掘,帮助模型算法提升识别能力;
3、对内容治理的算法特征能力建设进行进度追踪管理,主动发现问题、提出解决方案、验证数据效果;
4、理解生态业务的完整流程,支持抖音内容生态的后台工具搭建,提升相关团队查询和定位问题的效率。
包括英文材料
学历+
大模型+
数据分析+
SQL+
相关职位

logo of kuaishou
社招D4910

1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动​​数据-模型-评测​​迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,​​如​​跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。

更新于 2025-08-05
logo of xiaohongshu
社招3-5年审核策略

1、设计质量评估体系: 主导设计并持续优化面向人审、机审、大模型交付质量的全局性评估指标体系、评估链路与校准机制。 2、深度分析与洞察:带领团队对误伤和漏放的质量问题进行根因分析,定位问题至规则、模型、流程或人为维度,明确问题根本原因并输出解决方案; 3、主导治理效果评估: 深度分析治理策略的VVR 等核心业务指标影响,从用户体验和商业价值维度评估治理动作的ROI,为战略决策提供依据。 4、闭环推动与协同: 主动协同并驱动治理产品、规则策略、算法模型、审核运营等多方团队,建立高效的质量问题发现、定位、解决、复盘的全链路闭环机制。确保数据洞察转化为具体的产品功能迭代、规则优化、模型Retrain或流程改进,并对最终效果负责。 5、团队与能力建设:负责组建、培养和管理一支高绩效的数据分析与策略运营团队,提升团队成员的业务洞察、数据分析和项目推动能力。将最佳实践沉淀为可复用的分析模型、工具产品和方法论,提升整个中台的质量评估效率;

更新于 2025-10-15
logo of eleme
社招3年以上客户体验-业务体

1. 基于业务规则和策略,负责制定模型算法的业务策略及输出整体业务需求,推进大模型应用到实际业务,有效提升判责品效。 2. 统筹多类别算法模型的项目管理、流程优化、质量把控工作。对优质内容有判断力和敏感度,能够基于业务目标,进行大模型效果监控、评估、分析、反馈,输出改进策略并推动优化迭代。 3. 与上下游产品技术通力合作,负责标注工作的组织和协调,推动项目成果交付。 4. 密切关注竞品与行业动态,对AI新方向和行业保持研究,输出专业、精准切具有可行性的AI策略建议,联合算法产出新的AI应用能力。

更新于 2025-10-14
logo of bytedance
社招JANJL

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法在国际化电商场景的落地与提升,提升亿级用户搜索体验; 2、参与国际化电商搜索算法的优化与迭代,提升转化效率、用户体验和供给生态;解决多语言相关性匹配、权威性感知、种草内容理解、重复铺货、山寨假货治理等技术难题,极致优化内容电商、传统货架电商等多种电商业务形态的基础搜索质量;极致提升商品、种草视频和带货直播的购物转化效率,促进GMV增长; 3、深入参与核心搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升电商搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。

更新于 2022-04-13