字节跳动后端研发工程师(大模型数据智能平台)-信息服务中台
任职要求
1、本科及以上学历,计算机/人工智能相关专业,具备大模型研发或数据工程经验; 2、扎实的工程能力(Python/Go),熟悉分布式系统、高并发任务调度及多模态数据处理; 3、有数据标注平台、AI训练数据管道开发经验者优先,熟悉大模型数据生产流程(合成/清洗/标注); 4、具备代码大模型优化经验或主导过大模型项目者优先,有顶会论文者加分; 5、优秀的跨团队协作能力,能通过技术创新解决业务问题,推动技术商业化落地; 6、具备良好的产品/业务意识,有较好的沟通能力和自我驱动能力。
工作职责
1、负责大模型数据智能平台的核心研发,构建多模态标注、合成数据生成和高质量数据蒸馏系统,同时深入研究大模型工作原理并探索创新应用场景; 2、主导大模型应用的构建全过程,从需求分析、模型设计到开发实现与优化,确保数据平台的高效性与准确性,持续调优模型性能; 3、通过数据分析与算法改进,优化大模型数据供应链(标注、合成、蒸馏),提升模型效果和用户体验,并与跨部门团队协作推动项目落地; 4、关注行业前沿技术,引入创新算法理念,为数据平台的技术发展提供前瞻性建议,特别是在代码生成、模型对齐与持续学习等领域的应用突破。
1、支持各类业务的数据需求,为豆包、剪映、抖音等多个业务提供完整的数据解决方案,深度参与大模型业务迭代,助力AI的快速演进; 2、打造多模态数据获取和数据处理引擎,构建较大规模、较低成本、智能化的数据工程能力,建设全网多模态数据知识库,面向大模型训练提供端到端数据寻源、获取、理解与加工的解决方案,助力AI业务快速发展; 3、面向大模型训练与优化的全流程数据需求,构建多模态智能标注与数据增强系统,支持自动化标注、AI辅助标注、专家级人工校验,打造高精度、高一致性的数据生产流水线,为大模型持续进化提供优质数据燃料; 4、打造数据智能产品市场和专业平台服务,为业务提供全域数据的舆情应用和商情线索解决方案,降低业务获取信息的成本,提高对全网实时数据应用的效果,打造一个人人可用的企业级智能信息助理。
团队介绍:DevMind团队负责字节跳动研发数字化管理平台开发工作,提供数据挖掘引擎,指标管理,在线化报告,可视化分析等产品能力,通过对研发效能全量数据进行度量、洞察,辅助决策与改进,实现“数据驱动研发效能提升”。随着AI技术高速发展,团队将重塑软件工程价值度量体系,我们正构建覆盖业务架构、软件架构、部署架构的智能化度量基座。 1、利用大模型、数据挖掘等技术从研发数据资产中,构建起软件工程的度量、价值体系,辅助研发团队提升软件工程研发效能; 2、利用大模型、知识图谱等技术,建立基于字节跳动内部专家知识库,提供软件工程优化改进建议,帮助企业/团队提升决策&协作效率; 3、基于LLM的探索性数据分析系统研发,能够基于研发效能数据进行相关性、归因等数据分析,提供有价值的数据洞见和改进建议; 4、持续调研业界前沿数据分析技术和最新数据智能化技术,结合实际场景进行有效实施并达到行业前列水平; 5、进行模型选型,调优,评测,知识库搭建,帮助产品达到好的用户体验和效果。
负责蚂蚁数据分析平台的数据分析智能助理Copilot、数据分析Manus等智能化产品的调研、开发、运维、用户答疑。通过智能化技术升级产品体系,降低数据分析门槛,从而提升数据分析的效率和效果。