字节跳动NLP算法实习生-电商业务
任职要求
1、2025届硕士及以上学历在读,计算机等相关专业; 2、扎实的机器学习经验,熟悉自然语言处理领域相关知识,熟练掌握常用NLP算法; 3、具有丰富的NLP技术落地…
工作职责
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、参与电商场景下文本相关的视频内容理解能力建设; 2、参与电商场景下可控文本生成能力建设; 3、探索NLP相关前沿技术,并应用落地到电商业务场景中。
Bytelntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、参与电商场景下文本、多模态相关模型能力建设,包括但不限于:大模型多模态、关键信息抽取、实体识别、文本分类、知识图谱构建等; 2、参与构建业内领先的内容安全、内容生态识别方法,探索前沿技术(如NLP大模型、多模态大模型的训练和运用相关),并应用落地到电商业务场景中; 3、参与分析模型落地对电商生态的正面影响。
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、参与电商场景下文本相关的视频内容理解能力建设; 2、参与电商场景下可控文本生成能力建设; 3、探索NLP相关前沿技术,并应用落地到电商业务场景中。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。