logo of xiaohongshu

小红书【26届实习】深度学习推理/训练引擎研发工程师

实习兼职机器学习平台地点:北京 | 上海状态:招聘

任职要求


1、优秀的代码能力、数据结构和基础算法功底,熟悉C++/Python开发,熟悉 Linux 开发环境;
2、熟悉至少一种主流基础深度学习训练或推理框架(TensorFlow/PyTorch/PaddlePaddle/TensorRT等)的使用和实现;
3、熟悉主流LLM模型结构,熟悉至少一种主流LLM训练或推理框架(Megatron-LM/DeepSpeed/vLLM/TensorRT-LLM等)的使用和实现;
4、熟悉GPU硬件架构,了解GPU 软件栈(CUDA,cuDNN),具备 GPU 性能分析的能力;
5、有强烈的工作责任心,较好的学习能力、沟通协作能力和自驱力,能和团队一起探索新技术,推进技术进步。

加分项:
1、熟悉蒸馏、剪枝、量化等模型压缩方案,有大模型压缩或小型化经验、或有相关论文者优先;
2、熟悉CUDA编程,有TensorRT或其它AI加速库、高性能算子开发经验者优先;
3、熟悉至少一种AI编译加速组件者优先,包含但不限与TorchInductor/TVM/Triton/XLA等;
4、熟悉DP/TP/PP/ZeRO等分布式训练策略原理,有大模型训练调优分析经验者优先;
5、了解并行计算、网络通信、系统优化和集群硬件架构等相关知识者优先;
6、熟悉NCCL/RDMA/IB/RoCE相关知识者优先;
7、有优秀开源项目经历者优先。

工作职责


1、研发面向大语言/多模态/CV/NLP等类型模型的推理与训练框架;
2、参与推理框架研发优化,包括算子优化、推理架构优化、异构调度等多种技术研发落地等;
3、参与训练框架研发优化,包括数据读取、分布式训练及微调工具链等AI基础设施的建设等;
4、参与多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效;
5、与公司各算法部门深度合作,参与大语言模型、多模态大模型、计算机视觉、语音、自然语言处理等业务训推任务的优化提效;
6、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等。
包括英文材料
数据结构+
算法+
C+++
Python+
Linux+
深度学习+
TensorFlow+
PyTorch+
PaddlePaddle+
TensorRT+
大模型+
Megatron+
DeepSpeed+
vLLM+
CUDA+
相关职位

logo of alibaba
实习阿里国际2026

Bravo 102是由阿里国际技术全团队共同发起的全球顶尖技术人才孵化计划,打破传统人才选拔及培养框架,为有志于走向AI未来的技术新锐们,提供“你行你上+我要我来”的双向奔赴式的实习机会选择。 在这里,“我”将不被岗位定义,以能力选择业务战场,与全球顶尖团队并肩作战,沉浸式体验全球多元化业务战场与亿级流量高并发系统。 加入我们,成为AIDC首批102位Bravo Talent,一起掌舵AI,为我们的未来Bravo! 关于我们: 阿里国际技术专注于提供卓越的数字零售技术服务,致力于服务全球消费者,并触达全球中小企业买家。我们希望利用AI技术让每个人都能够轻松、便捷地享受全球优质的商品和服务,推动商业活动更加高效、可持续,为社会未来的发展带来更多可能性。 我们提供涵盖商品智能、商家服务、供应链优化、跨境物流、搜索推荐引擎、用户增长、金融服务、客户体验、AI 基础设施、企业数智化、全球云及高可用架构、研发效能等技术领域,实习生可跨多个技术域实践,深度参与多场景技术攻坚,探索你想选择的职业发展方向; 在这里,你将和我们一起,采用领先的数字化及人工智能等技术持续解决商业活动中的现实问题,创造技术价值,为消费者带来更加美好的体验!欢迎加入我们! 职位描述: 1、负责大语言模型、图像模型、多模态等深度学习模型的在线推理、离线训练优化工作; 2、负责AI 生态内基础引擎系统能力的建设,包括信息检索、AI 记忆、流程调度等。 3、负责 AI 算法服务能力建设,针对业务场景的真实需求,设计合理的技术方案和路线

更新于 2025-07-08
logo of bytedance
实习A117737

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习在线服务框架的研究与开发,服务于公司各个产品; 2、高效部署,优化计算机视觉、语音识别、语音合成、自然语言处理等字节跳动业务模型; 3、与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能。

更新于 2025-02-14
logo of bytedance
实习A188930

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习在线服务框架的研究与开发,服务于公司各个产品; 2、高效部署,优化计算机视觉、语音识别、语音合成、自然语言处理等字节跳动业务模型; 3、与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能。

更新于 2025-02-14
logo of bytedance
实习A135430

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习在线服务框架的研究与开发,服务于公司各个产品; 2、高效部署,优化计算机视觉、语音识别、语音合成、自然语言处理等字节跳动业务模型; 3、与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能。

更新于 2025-02-14