字节跳动大模型推理和优化工程师-电商业务
任职要求
1、扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先; 2、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、算子优化等; 3、了解业界常用的大语言模型推理加速框架,如SGLang,VLLM,TensorRT-LLM等; 4、有CUDA开发经验…
工作职责
1、推理框架开发,适配电商内部自研NLP/CV/MLLM等模型架构,开发针对电商场景的高性能推理框架; 2、模型推理加速研究,包括但不限于模型量化蒸馏剪枝,低精度计算,CUDA算子优化,并行计算优化,投机采样,PD分离等加速手段; 3、负责模型训练优化算法的研究与开发,运用数据并行、模型并行、通信优化等前沿技术,提升模型训练速度及效率; 4、技术输出:定期分享训练和推理优化技术,助力业务,沉淀专利和论文。
1、推理框架开发,适配电商内部自研NLP/CV/MLLM等模型架构,开发针对电商场景的高性能推理框架; 2、模型推理加速研究,包括但不限于模型量化蒸馏剪枝,低精度计算,CUDA算子优化,并行计算优化,投机采样,PD分离等加速手段; 3、负责模型训练优化算法的研究与开发,运用数据并行、模型并行、通信优化等前沿技术,提升模型训练速度及效率; 4、技术输出:定期分享训练和推理优化技术,助力业务,沉淀专利和论文。
团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,针对电商数据优化算法,支持模型训练和推理加速,提升电商业务效果。 1、模型压缩和推理框架开发:推理加速的研究,包括但不限于模型量化、剪枝、TensorRT、TensorRT-LLM推理优化等; 2、梳理&沉淀算法库:抽象算法接口,提高算法/预训练模型的复用率,同时优化数据采集和模型训练的流程,提升效率; 3、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文。
团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,针对电商数据优化算法,支持模型训练和推理加速,提升电商业务效果。 1、模型压缩和推理框架开发:推理加速的研究,包括但不限于模型量化、剪枝、TensorRT、TensorRT-LLM推理优化等; 2、梳理&沉淀算法库:抽象算法接口,提高算法/预训练模型的复用率,同时优化数据采集和模型训练的流程,提升效率; 3、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文。
业务介绍: 我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、负责支持业务迭代:推进来自搜索、推荐、广告、用增各域的产品需求快速落地。 2、负责系统架构设计:负责搜索、推荐、广告引擎的架构设计与优化,支撑多语言场景下的高并发请求处理,满足全球用户低延迟、高可用的服务需求。 3、负责性能调优:针对召回排序、模型训练&推理、特征计算等模块进行工程性能优化(如分布式计算加速、内存管理、GPU资源调度等),提升算法迭代效率。 4、负责工程平台开发:构建算法与工程协同的标准化平台,包括特征实时化平台、在线推理服务框架、AB实验平台等,支持算法快速迭代与业务效果验证。 5、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速、多模态内容生成等技术工作。 补充说明:同时也招聘面向25年应届毕业的同学;