字节跳动多模态大模型算法实习生-电商业务(平台治理方向)
任职要求
1、2026届硕士及以上学位在读,计算机相关专业; 2、具有多模态大模型、NLP/CV深度模型等的训练和应用经验,精通大模型、多模态、CV、NLP等的1-2个领域,优秀的分析和解决问题的能力,对挑战性问题充满激情; 3、具备扎实的代码功底,具备Linux环境研发能力,精通Python和PyTorch等深度学习框架,具备扎实的数据结构/算法基础,熟练掌握机器学习/深度学习理论知识,并具有丰富实践经验; 4、具备良好的团队合作精神,较强的沟通能力; 5、有高水平论文的优先,包括但不限于ACL、EMNLP、COLING、WWW、AAAI等; 6、实践动手能力强,ACMICPC、NOI/IOI、Top Coder、Kaggle比赛获奖者优先。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、深入理解电商业务,并基于电商领域知识,构建围绕电商场景的多模态大模型底座,包括但不限于:数据优化以及数据合成、领域预训练、指令微调、有监督微调等; 2、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类、风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 3、负责强化电商治理场景下,大模型推理和反思能力,通过业务域SFT、高质量CoT、强化学习、数据合成等技术方案,持续提升大模型业务理解能力; 4、探索基于多模态大模型的电商智能审核系统,实现大规模的机器自动审核,包括:治理规则理解,商品和内容(直播、短视频)的信息抽取、内容理解、风险识别、问题推理等; 5、建设基于多模态大模型的电商智能售后Agent,实现模型自动理解消费者意图并智能化给出解决方案,包括:智能仲裁、智能判责、智能售后等。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、深入理解电商业务,并基于电商领域知识,构建围绕电商场景的多模态大模型底座,包括但不限于:数据优化以及数据合成、领域预训练、指令微调、有监督微调等; 2、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类、风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 3、负责强化电商治理场景下,大模型推理和反思能力,通过业务域SFT、高质量CoT、强化学习、数据合成等技术方案,持续提升大模型业务理解能力; 4、探索基于多模态大模型的电商智能审核系统,实现大规模的机器自动审核,包括:治理规则理解,商品和内容(直播、短视频)的信息抽取、内容理解、风险识别、问题推理等; 5、建设基于多模态大模型的电商智能售后Agent,实现模型自动理解消费者意图并智能化给出解决方案,包括:智能仲裁、智能判责、智能售后等。
Bytelntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、多模态大模型算法研发:负责电商场景下,图文,图视频,音频,OCR,口播等多个模态的预训练和对齐,产出多模态大模型的统一底座,用于电商治理场景所有多模态需求使用; 2、基础算法研发:负责CV/多模态相关模型优化和迭代,多模态表征学习,产出电商通用的预训练模型,Embedding等,用于包含视频意图理解、视频商品类目、同款/相似商品识别、图文意图判断,图文质量治理等电商任务; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
Bytelntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、多模态大模型算法研发:负责电商场景下,图文,图视频,音频,OCR,口播等多个模态的预训练和对齐,产出多模态大模型的统一底座,用于电商治理场景所有多模态需求使用; 2、基础算法研发:负责CV/多模态相关模型优化和迭代,多模态表征学习,产出电商通用的预训练模型,Embedding等,用于包含视频意图理解、视频商品类目、同款/相似商品识别、图文意图判断,图文质量治理等电商任务; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、深入理解电商业务,并基于电商领域知识,构建围绕电商场景的文本大模型底座,包括但不限于:数据优化以及数据合成、领域预训练、指令微调、有监督微调等; 2、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类、风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 3、负责强化电商治理场景下,大模型推理和反思能力,通过业务域SFT、高质量CoT、强化学习、数据合成等技术方案,持续提升大模型业务理解能力; 4、探索基于文本大模型的电商智能审核系统,实现大规模的机器自动审核,包括:治理规则理解,商品和内容(直播、短视频)的信息抽取、内容理解、风险识别、问题推理等; 5、建设基于文本大模型的电商智能售后Agent,实现模型自动理解消费者意图并智能化给出解决方案,包括:智能仲裁、智能判责、智能售后等。