logo of taptap

TapTapTapTap 模型推理优化工程师(上海)

社招全职技术大类地点:上海状态:招聘

任职要求


1.计算机科学、数据科学或相关专业,熟练掌握C++Python等至少一门编程语言;
2.有丰富的模型训练、推理优化经验,熟悉CUDA,ROCM,OpenCL技术,有基于GPU结构性能调优的经验。
3.熟悉至少一种深度学习框架(Tensorflow/Pytorch/MXNet等),对其底层原理有深入研究。
4.熟悉推理优化常用技术,如特征存取、算子融合、模型并行、流水线、模型量化、混合精度等,有相关

工作职责


1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务;
2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能;
3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中;
4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
包括英文材料
数据科学+
C+++
Python+
CUDA+
OpenCL+
性能调优+
深度学习+
TensorFlow+
PyTorch+
MXNet+
相关职位

logo of xd
社招技术大类

1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。

更新于 2025-10-09
logo of kuaishou
社招D8950

从事AIGC相关领域的硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一: 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作; 2、业界AIGC主流模型在推理侧的性能分析与优化工作。

更新于 2025-02-17
logo of bytedance
校招A150980

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责超大规模机器学习推理系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型推理、数据管理、工作流编排等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、存算一体系统、编译优化技术的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-04-21
logo of bytedance
社招A212932

1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。

更新于 2025-09-01