logo of bytedance

字节跳动AI模型训练和推理优化工程师-电商

社招全职A16043地点:上海状态:招聘

任职要求


1、扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先;
2、熟悉TensorFlow/PyTorch模型的训练和部署,了解混合精度训练、分布式训练等训练加速方法优先;
3、了解模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TensorRT推理优化等;
4、了解业界常用的大语言模型推理加速框架,如VLLM,TensorRT-LLM等;
5、在深度学习…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,针对电商数据优化算法,支持模型训练和推理加速,提升电商业务效果。

1、模型压缩和推理框架开发:推理加速的研究,包括但不限于模型量化、剪枝、TensorRT、TensorRT-LLM推理优化等;
2、梳理&沉淀算法库:抽象算法接口,提高算法/预训练模型的复用率,同时优化数据采集和模型训练的流程,提升效率;
3、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文。
包括英文材料
TensorFlow+
PyTorch+
TensorRT+
大模型+
还有更多 •••
相关职位

logo of alibaba
社招技术类-开发

业务介绍: 我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、负责支持业务迭代:推进来自搜索、推荐、广告、用增各域的产品需求快速落地。 2、负责系统架构设计:负责搜索、推荐、广告引擎的架构设计与优化,支撑多语言场景下的高并发请求处理,满足全球用户低延迟、高可用的服务需求。 3、负责性能调优:针对召回排序、模型训练&推理、特征计算等模块进行工程性能优化(如分布式计算加速、内存管理、GPU资源调度等),提升算法迭代效率。 4、负责工程平台开发:构建算法与工程协同的标准化平台,包括特征实时化平台、在线推理服务框架、AB实验平台等,支持算法快速迭代与业务效果验证。 5、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速、多模态内容生成等技术工作。 补充说明:同时也招聘面向25年应届毕业的同学;

更新于 2025-04-02北京|杭州
logo of alibaba
社招2年以上技术类-开发

职位描述: 我们正在寻找一位热衷于大模型和Agent智能体技术创新的Agent研发工程师,通过业界前沿技术驱动电商交易业务增长,构建行业领先的智能交易决策体系。你将有机会参与从0到1的技术研发,探索大模型和Agent在实际业务中的应用。 您的职责: 1. 设计并搭建面向「AI」和「产技同学」的交易Agent平台,颠覆常规需求的交付流程,定义并规范AI时代的业务型Agent交付的新标准,打造行业领先的AI交易解决方案。 2. 深入研究面向AI智能体的前沿技术和先进思想,掌握业界大模型的特性,融会贯通,贴合业务诉求在交易Agent平台中实际落地,完善平台架构。并不断迭代优化,包括:Agent范式、Prompt生成&管理、Tools、Memory、RAG、大模型训练/微调、评测等各方面。 3. 作为Agent平台核心成员,具备优秀的AI技术素养,独当一面,能给业务方提供建设性建议和方案,包括:提示词设计,业务Agent实现方案,大模型选择方案等。 4. 保障Agent平台的稳定性和业务效果稳定性。

更新于 2025-04-14杭州
logo of pinduoduo
社招技术类

1、构建适合电商领域的大模型,提供高性能低成本的在离线解决方案,与算法工程师密切合作,持续提升大模型的能力 2、设计开发大模型训练系统,优化实现多种并行策略、算子优化、ZeRO技术、FlashAttention、量化技术、高性能Reduce通信库等,极致优化训练性能 3、设计开发大模型推理系统,应用PagedAttention、Batching优化、GPU算子优化、量化与压缩等技术,构建高吞吐、低延迟、支持数万QPS的在线服务 4、跟进最新的AI算法和infra的进展,并高效地将新技术落地应用到PDD电商的实际业务中,为消费者创造价值

更新于 2026-05-12上海
logo of alibaba
社招技术类-开发

团队与角色介绍: 我们是阿里巴巴国际数字商业集团(AIDC)的智能技术-智能引擎团队,负责支撑包括Lazada、AliExpress、Miravia、Daraz等在内的阿里巴巴全球化电商平台的搜索、推荐、广告、用户增长等核心技术。我们致力于将AI领域最前沿的技术(如深度学习、大模型、Agent等)与全球化电商业务的复杂挑战深度融合,持续打造更智能、更极致的全球购物体验,并赋能数百万商家实现数字化经营提效。 岗位描述: 1、负责算法工程平台建设:构建算法与工程协同的标准化平台,包括特征平台、训练平台、在线推理框架等,支持算法在模型侧的快速迭代与业务效果验证。 2、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速等技术工作。 3、负责AI创新应用探索:探索AI在搜推广场景的创新应用,如生成式召回,生成式排序、行为大模型等,以及AI agent在智能运维、资源优化、客服助手等场景上的应用。 补充说明:同时也招聘面向25年应届毕业的同学;

更新于 2025-06-19北京