字节跳动大模型数据工程师-国际化业务
任职要求
1、熟悉数据仓库实施方法论和常见的数据仓库技术,包括大数据组件、数据建模、数据治理等,有较强的业务抽象能力和数据架构能力; 2、熟练使用Spark/Flink等大数据技术栈,熟悉SQL、Java、Python等编程语言; 3、思维逻辑清晰,良好的自驱力、沟通能力,具备优秀的技术与业务结合能力; 4、有大模型应用经验、工程开发(数据后端)经验是加分项。
工作职责
1、负责数据仓库架构设计、建模和ETL开发; 2、深入业务,合理建设指标体系和报表体系,与数据分析师/产品经理紧密合作,探索和落地基于业务场景的数据解决方案; 3、利用大模型能力,构建创新的工具和解决方案,提升数据资产的建设质量和效率,降低找数用数门槛,提升数据易用性。
1、 负责国际化电商业务的离线与实时数据仓库的构建; 2、负责数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 3、负责指标体系建设与维护; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与大数据应用规划,为数据产品、挖掘团队提供应用指导; 6、参与数据治理工作,提升数据易用性及数据质量。
1、负责国际化电商业务的离线与实时数据仓库的构建; 2、负责数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 3、负责指标体系建设与维护; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与大数据应用规划,为数据产品、挖掘团队提供应用指导; 6、参与数据治理工作,提升数据易用性及数据质量。
1.参与美团全球化业务中智能客服、智能审核、智能外呼等核心场景的大模型应用研发与落地工作。 2.针对跨文化、多语言、少样本等复杂业务挑战,研究并应用强化学习、多模态学习、高效后训练等前沿技术,对大模型进行深度优化与能力增强,提升模型在实际业务中的表现。 3.主要研究方向包括但不限于: a. 任务型对话技术攻关: 研究强化学习与高效后训练方法在多模态任务型对话中的应用,优化全球用户的复杂服务请求处理与任务达成效果。 b. 少样本多模态理解与推理: 探索在海外数据稀疏环境下,通过少样本学习等手段构建强大的多模态理解与推理能力,支持高效合规审核及风险识别。 c. 可控对话生成与知识融合: 面向智能外呼等场景,研究多语言环境下可控对话生成及知识融合技术,提升沟通的自然度、准确性和业务转化率,并追踪前沿技术动态,推动创新落地。
【课题说明】 外卖业务在国际市场上展现出前所未有的增长潜力,全球化运营对智能化提出更高要求。本课题致力于运用大模型技术,结合后训练、多模态、强化学习等手段,打造覆盖智能客服、智能审核、智能外呼的下一代全球服务系统,核心在于高效完成跨文化背景下的复杂任务。 【建议研究方向】 1.任务型对话的强化学习与后训练:研究如何结合强化学习激励与高效后训练方法,使大模型能精准理解并高效完成全球用户、商家及骑手提出的多模态复杂服务任务。 2.少样本多模态理解与推理:探索在数据相对稀疏的海外市场中,如何构建强大的多模态大模型,以支持对用户、骑手、商家上传图文的高效合规审核与风险识别。 3.外呼场景下的可控对话:研究通过可控生成技术并有效融入领域知识,提升大模型在招聘、商家/骑手沟通等多语言智能外呼任务中对话的自然度、信息准确性与目标达成率。