字节跳动AI搜推算法工程实习生-Data AML
任职要求
1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、熟练掌握C++,Python等编程语言,有GPU编程(CUDA)、AI编译器、分布式计算的经验; 3、对PyTorch推理加速有经验,如对FX、Dynamo、TensorRT、Triton等有深入了解; 4、对PyTorch/Tensorflow框架有了解,熟悉常用的搜索推荐算法、长序列建模、多模态推荐等; 5、在网络通信优化方面,对TCP、RPC、NCCL等比较了解,能做深度通信优化; 6、对机器学习框架比较了解,以上内容有一项特别强即可。 加分项: 1、好奇心强,热爱技术且对特定领域有深入钻研; 2、有直接面向用户的产品开发经验。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责内部MonoTorch训练框架的研究与开发,服务于搜索,广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责内部MonoTorch训练框架的研究与开发,服务于搜索,广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责内部MonoTorch训练框架的研究与开发,服务于搜索,广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
在当前业界的搜索推荐系统中,召回、粗排、精排、重排、混排等算法已有相对成熟的一套框架推动搜推业务进入深水区。AI的发展为搜推场景注入了新的可能性,具体来说,我们希望同学加入解决以下业务问题: 1. AI对搜推场景的算法优化 a. 通过大模型(LLM、多模态大模型)的推理能力、世界知识能力,提升对用户的理解。 b. 通过大模型(LLM、多模态大模型)SFT、RL、RAG等技术手段,实现对用户需求更好的承接。 c. 研究大模型和经典搜推算法的融合方案,提升场景整体效果和用户体验。 d. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用。 2. 下一代AI搜推系统构建 a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署。 b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用。