字节跳动电商多模态大模型算法实习生-电商业务
任职要求
1、2026届硕士及以上学位在读,计算机相关专业; 2、扎实的深度学习技术基础,有CV/NLP/多模态相关的项目经验,发表过高水平学术会议论文或者有竞赛经验者优先; 3、熟练掌握Python/C++等至少一门编程语言;熟练Pytorch训练框架;熟悉Hunggingface-Transformers框架; 4、熟悉常用的大语言模型架构优先; 5、了解模型压缩&推理加速的研究和技术进展,包括但不限于模型量化、剪枝、蒸馏、TensorRT推理优化等; 6、了解业界常用的大语言模型推理加速框架,如VLLM,TensorRT-LLM;了解混合精度训练、分布式训练等训练加速方法优先。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
Bytelntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、多模态大模型算法研发:负责电商场景下,图文,图视频,音频,OCR,口播等多个模态的预训练和对齐,产出多模态大模型的统一底座,用于电商治理场景所有多模态需求使用; 2、基础算法研发:负责CV/多模态相关模型优化和迭代,多模态表征学习,产出电商通用的预训练模型,Embedding等,用于包含视频意图理解、视频商品类目、同款/相似商品识别、图文意图判断,图文质量治理等电商任务; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
Bytelntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 1、多模态大模型算法研发:负责电商场景下,图文,图视频,音频,OCR,口播等多个模态的预训练和对齐,产出多模态大模型的统一底座,用于电商治理场景所有多模态需求使用; 2、基础算法研发:负责CV/多模态相关模型优化和迭代,多模态表征学习,产出电商通用的预训练模型,Embedding等,用于包含视频意图理解、视频商品类目、同款/相似商品识别、图文意图判断,图文质量治理等电商任务; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。