logo of bytedance

字节跳动多模态大模型算法实习生-电商业务

实习兼职A204584地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机相关专业优先;
2、在NLP算法、多模态算法大模型训练和应用、搜索推荐、知识图谱等领域有实际的开发和从业经验者优先;
3、有好奇心,喜欢新事物,善于合作,有创新精神,有一定的抗压能力;
4、至少熟悉一门计算机编程语言,包括但不限于C/C++/Java/Go/Python;
5、有高水平论文的优先,包括但不限于ACL、EMNLP、COLING、WWW、AAAI等;
6、实践动手能力强,ACMICPC、NOI/IOI、Top Coder、Kaggle比赛获奖者优先。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。

1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息;
2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现;
3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性;
4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等;
5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。
包括英文材料
学历+
NLP+
算法+
大模型+
C+
C+++
Java+
Go+
Python+
Kaggle+
相关职位

logo of bytedance
实习A162344

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。

更新于 2025-02-07
logo of bytedance
实习A31544

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。

更新于 2025-02-07
logo of bytedance
实习A12471

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、深入理解电商业务,并基于电商领域知识,构建围绕电商场景的多模态大模型底座,包括但不限于:数据优化以及数据合成、领域预训练、指令微调、有监督微调等; 2、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类、风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 3、负责强化电商治理场景下,大模型推理和反思能力,通过业务域SFT、高质量CoT、强化学习、数据合成等技术方案,持续提升大模型业务理解能力; 4、探索基于多模态大模型的电商智能审核系统,实现大规模的机器自动审核,包括:治理规则理解,商品和内容(直播、短视频)的信息抽取、内容理解、风险识别、问题推理等; 5、建设基于多模态大模型的电商智能售后Agent,实现模型自动理解消费者意图并智能化给出解决方案,包括:智能仲裁、智能判责、智能售后等。

更新于 2025-02-12
logo of bytedance
实习A25368

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、深入理解电商业务,并基于电商领域知识,构建围绕电商场景的多模态大模型底座,包括但不限于:数据优化以及数据合成、领域预训练、指令微调、有监督微调等; 2、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类、风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 3、负责强化电商治理场景下,大模型推理和反思能力,通过业务域SFT、高质量CoT、强化学习、数据合成等技术方案,持续提升大模型业务理解能力; 4、探索基于多模态大模型的电商智能审核系统,实现大规模的机器自动审核,包括:治理规则理解,商品和内容(直播、短视频)的信息抽取、内容理解、风险识别、问题推理等; 5、建设基于多模态大模型的电商智能售后Agent,实现模型自动理解消费者意图并智能化给出解决方案,包括:智能仲裁、智能判责、智能售后等。

更新于 2025-02-12