心动TapTap 模型推理优化工程师(上海)
任职要求
1.计算机科学、数据科学或相关专业,熟练掌握C++、Python等至少一门编程语言; 2.有丰富的模型训练、推理优化经验,熟悉CUDA,ROCM,OpenCL技术,有基于GPU结构性能调优的经验。 3.熟悉至少一种深度学习框架(Tensorflow/Pytorch/MXNet等),对其底层原理有深入研究。 4.熟悉推理优化常用技术,如特征存取、算子融合、模型并行、流水线、模型量化、混合精度等,有相关工作经验者优先。 5.熟悉DeepSpeed, Megatron等大模型分布式训练框架,对模型优化技术有深…
工作职责
1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
1.负责 TapTap 离线训练、在线推理框架的优化与开发,服务于公司各个业务线,如搜索、推荐、广告、AI 等业务; 2.与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能; 3.设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 4.探索业界前沿的机器学习相关技术,持续提升平台能力,降低算法使用成本。
项目简介 我们在做一套面向创作者与玩家的 AI 驱动 UGC 平台:支持关卡/脚本/素材的在线创作与分发,内置智能生成、审核与协作能力。你将从 0→1 共建核心后端,包括内容存储、实时协作、生成任务编排与审核、安全风控与运营后台等。 负责后端核心模块的架构设计与开发(用户/作品/发布流/评论与审核/计费与权限等); 搭建实时能力:联机协作/作品预览/在线游玩所需的 WebSocket/gRPC/事件流; 建设 UGC 内容安全与审核(文本/图片/音频/脚本):策略配置、人工+AI 联动、申诉流程; 以敏捷迭代面向 MVP:快速拆解需求、度量与回滚、数据驱动优化; 推动工程效率与质量:利用 AI 编程工具进行脚手架生成、重构、单元/集成测试补齐与文档生成; DevOps 与稳定性:CI/CD、可观测性(日志/指标/Tracing)、容量与性能优化、成本管控、基础安全。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。