logo of xd

心动TapTap 模型推理优化工程师(上海)

社招全职技术大类地点:上海状态:招聘

任职要求


1.计算机科学、数据科学或相关专业,熟练掌握C++Python等至少一门编程语言;
2.有丰富的模型训练、推理优化经验,熟悉CUDA,ROCM,OpenCL技术,有基于GPU结构性能调优的经验。
3.熟悉至少一种深度学习框架(Tensorflow/Pytorch/MXNet等),对其底层原理有深入研究。
4.熟悉推理优化常用技术,如特征存取、算子融合、模型并行、流水线、模型量化、混合精度等,有相关工作经验者优先。
5.熟悉DeepSpeed, Megatron大模型分布式训练框架,对模型优化技术有深入研究的优先;
6.了解主流 AIGC 算法模型原理,有AIGC模型加速优化经验优先。

加分项:
熟悉深度学习框架和底层实现;
熟悉 CV / NLP /推荐系统相关的深度学习算法;
对深度学习训练和推理模型调试、调优有实操经验;
熟悉 TVM 、MLIR 、XLA 等模型优化工具;
有研究生或博士阶段的计算机系统方向(包含分布式系统、并行算法、编程语言与编译器、RDMA 网络、存储、高性能计算等)研究背景;
有软硬件联合设计,底层性能优化(Cutlass ,NCCL 等)的经验;
贡献过开源社区代码。

工作职责


1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务;
2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能;
3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中;
4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
包括英文材料
数据科学+
C+++
Python+
CUDA+
OpenCL+
性能调优+
深度学习+
TensorFlow+
PyTorch+
MXNet+
DeepSpeed+
Megatron+
大模型+
算法+
NLP+
推荐系统+
分布式系统+
AIGC+
NCCL+
相关职位

logo of taptap
社招技术大类

1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。

更新于 2025-08-14
logo of taptap
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-08-15
logo of xd
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-09-28
logo of xd
实习技术大类

1. 研发面向用户增长场景的多模态大模型,包括文本、音频、图像、视频等多模态数据的理解与生成; 2. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 3. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-10-13