字节跳动机器学习研发工程师-搜索架构
任职要求
1、掌握扎实的计算机基础知识,深入理解数据结构、算法和操作系统知识; 2、有强烈的求知欲,快速学习和沟通能力; 3、编程能力扎实,有良好的编程习惯。 加分项: 1、熟悉主流的深度学习框架(Pytorch、Tensorflow); 2、…
工作职责
1、参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现; 2、关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化; 3、提高模型训练效率,加速推理性能,优化GPU吞吐; 4、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署。
1. 负责设计、研发和优化商业化模型推理服务和训练服务。 2. 负责商业化模型工程架构的持续迭代和发展。 3. 负责推动先进的模型技术应用于商业化业务场景。 4. 负责提升离在线服务的性能,优化资源分配和治理。
1、负责机器学习平台的设计和开发,包括模型训练、在线推理、高性能KV平台等系统; 2、设计、开发超大规模机器学习系统,优化现有技术方案,改善系统性能, 提高算法的整体迭代效率; 3、与业务团队积极沟通和合作,帮助业务更快的落地, 并持续优化和改进;
团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 工作职责 1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛 2. 进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验 3. 应用不限于剪枝、量化、知识蒸馏、分布式计算(数据并行、模型并行、混合并行)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能 4. 和工程团队协同,实施并维护自动化工具和流程,以简化和加速模型训练和推理的部署过程 5. 研究最新的机器学习和深度学习技术,跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并将其应用到淘宝搜索生产环境中 6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性