心动TapTap 模型推理优化工程师(上海)
任职要求
1.计算机科学、数据科学或相关专业,熟练掌握C++、Python等至少一门编程语言; 2.有丰富的模型训练、推理优化经验,熟悉CUDA,ROCM,OpenCL技术,有基于GPU结构性能调优的经验。 3.熟悉至少一种深度学习框架(Tensorflow/Pytorch/MXNet等),对其底层原理有深入研究。 4.熟悉推理优化常用技术,如特征存取、算子融合、模型并行、流水线、模型量化、混合精度等,有相关工作经验者优先。 5.熟悉DeepSpeed, Megatron等大模型分布式训练框架,对模型优化技术有深入研究的优先; 6.了解主流 AIGC 算法模型原理,有AIGC模型加速优化经验优先。 加分项: 熟悉深度学习框架和底层实现; 熟悉 CV / NLP /推荐系统相关的深度学习算法; 对深度学习训练和推理模型调试、调优有实操经验; 熟悉 TVM 、MLIR 、XLA 等模型优化工具; 有研究生或博士阶段的计算机系统方向(包含分布式系统、并行算法、编程语言与编译器、RDMA 网络、存储、高性能计算等)研究背景; 有软硬件联合设计,底层性能优化(Cutlass ,NCCL 等)的经验; 贡献过开源社区代码。
工作职责
1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。