字节跳动大模型数据服务专家(剪映)-DMC
任职要求
1、本科及以上学历,具有2年及以上大模型项目经验,有丰富的项目交付和管理经验,熟悉项目管理流程和方法; 2、对大模型有浓厚兴趣和一定的了解,对文生图,文生视频大…
工作职责
1、配合产品与算法侧,进行大模型模型训练数据样本集标注、模型迭代效果评估、风格化LoRA精调等,共同推进业务目标达成; 2、依据多模态以及视觉大模型发展阶段,站在视觉类大模型产品视角,制定科学合理的数据评测/交付方案; 3、负责面向外部供应商开展标准规则的培训与试标,对项目交付结果负责,包括制定项目交付计划,项目进度管理,项目风险管理,项目交付指标管理等; 4、对齐项目目标,设计PE及Agent自动化标注流程,优化数据构造方法与工具,带领团队高质量达成数据生产目标。
1、支持各类业务的数据需求,为豆包、剪映、抖音等多个业务提供完整的数据解决方案,深度参与大模型业务迭代,助力AI的快速演进; 2、打造多模态数据获取和数据处理引擎,构建较大规模、较低成本、智能化的数据工程能力,建设全网多模态数据知识库,面向大模型训练提供端到端数据寻源、获取、理解与加工的解决方案,助力AI业务快速发展; 3、面向大模型训练与优化的全流程数据需求,构建多模态智能标注与数据增强系统,支持自动化标注、AI辅助标注、专家级人工校验,打造高精度、高一致性的数据生产流水线,为大模型持续进化提供优质数据燃料; 4、打造数据智能产品市场和专业平台服务,为业务提供全域数据的舆情应用和商情线索解决方案,降低业务获取信息的成本,提高对全网实时数据应用的效果,打造一个人人可用的企业级智能信息助理。
1、负责将各类大模型(包括MoE架构、多模态模型及未来超大规模模型)高效部署至生产环境,持续跟踪并集成如vLLM、SGLang、xLLM等先进推理框架,保障新模型能够快速、高性能上线; 2、深入数据工程与模型蒸馏领域,通过数据合成、特征工程及知识蒸馏(如软标签蒸馏、特征蒸馏)等技术方案,系统性提升数据利用效率、降低模型部署成本,并验证其在业务中的可行路径; 3、探索并应用创作者Agent等前沿方向,将其能力赋能于训练样本自动合成、Train-Free冷启动及自动化评测等场景,革新传统数据与评估工作流; 4、对业务模型进行深度的推理性能优化,包括但不限于动态批处理、量化压缩、注意力机制优化等,持续降低服务延迟与资源消耗,并积累超大规模(如万亿参数)模型的部署经验与技术储备; 5、负责构建和优化大规模模型的强化学习(RL)、监督微调(SFT)及端到端训练的完整工程链路;提升训练流程的稳定性与吞吐量,并设计和复用离线验证与评测链路,为算法团队提供高效的迭代与效果评估环境。
岗位亮点 * 深度参与基于大模型的数字人产品运营,直面 AI 驱动的用户互动与增长挑战 * 结合智能客服、内容裂变与数据分析,实现从拉新到留存的全链路增长 岗位职责 1. AI驱动的客户体验优化: * 利用AI智能客服助手及在线工具,高效处理客户基础咨询,提供专业解答。 * 深度挖掘用户交互数据,识别高频问题与痛点,输出FAQ知识库优化建议,持续提升机器人解答准确率与用户体验。 * 分析服务流程数据,驱动产品部门迭代优化服务体验,提升用户满意度和留存率。 2. 增长导向的市场内容策划与制作: * 协助策划并制作高转化率的产品介绍PPT、宣传海报、活动文案等增长型营销素材,确保内容精准传递产品价值并符合品牌调性。 * 参与以用户增长为目标的市场活动策划,利用AI工具辅助创意生成,提供创意支持并协助高效落地执行。 * 探索A/B测试等方法优化素材效果,提升活动拉新与转化效率。 3. 数据驱动的跨部门协同: * 高效对接市场部增长需求,协调设计、产品等部门资源,确保高质量素材的及时交付。 * 沉淀用户反馈与市场数据洞察,形成闭环,驱动产品功能优化与增长策略调整。 4. 新媒体矩阵运营与用户激活: * 负责制作吸引用户、促进转化的短视频内容(如产品教程、亮点展示、活动预热/复盘),完成基础剪辑(剪映/PR)、字幕、音效处理。 * 负责微信公众号/抖音/小红书等核心增长渠道的图文内容排版与发布,确保内容符合平台调性及用户增长目标。