腾讯腾讯游戏-AIGC数据工程师-新星引力计划
1.负责AIGC相关业务系统的开发与维护,快速定位并解决线上问题; 2.解答AIGC业务相关问题,整理数据报表,有效对接业务和产品团队梳理需求; 3.协同项目外包团队,完成系统的建设、测试及部署上线等全流程工作; 4.开发和维护构建、发布、报表等自动化流水线; 5.构建强化学习训练与推理平台,提升系统性能。

1.设计并构建多模态数据评估体系,精准量化数据对大模型性能的影响,为数据生成策略的持续迭代提供有力支持,推动模型不断进化。 2.探索无监督与半监督数据生成技术,突破传统人工标注限制,打造低成本、高多样性的数据解决方案,为前沿算法研发注入源源不断的数据动力。 3.与顶尖算法工程师团队紧密协作,深度参与深度学习模型的研发全流程,设计并实现契合业务需求的高效数据解决方案,共同打造行业领先的大模型产品。 4.持续提升平台数据生产效率与易用性,降低算法开发门槛;积极探索并转化业界前沿的多模态数据处理技术,将创新成果落地为多场景业务应用,助力企业数字化转型。
从公共、合成和人工来源获取和汇集数据集。 -自动化数据收集、清理和注释工作流程。 -审查和充实数据的质量和相关性。 -设置和管理注释工具和指南。 -维护数据集版本控制和文档编写。 -整合用户和产品的反馈,以改进数据。 - 与算法工程师、产品经理和其他团队合作。
1、负责剪映CapCut AI数据工程与系统,同算法、产品团队协作完成稳健高效的数据处理Pipeline和系统的设计和研发,支持数据的生产、管理以及洞察等,助力算法模型快速迭代; 2、负责搭建模型效果评测体系与系统,支持多层级和多类型AIGC模型评测,以及测试集的构建、管理等,快速评估和优化模型以及端到端链路效果; 3、负责构建算法迭代自动化系统,提高数据驱动的模型迭代效率,以及使用Prompt Engineering和RAG等技术来提高模型和产品效果等; 4、负责构建统一的数据框架和基座,结合Data-Centric AI的理念,为剪映Capcut多个业务场景打造通用可靠的数据体系,推动业务快速发展。