米哈游【提前批】视频生成模型加速工程师
任职要求
1、学历背景:计算机科学、软件工程、人工智能等相关专业本科及以上学历 2、编程能力:精通Python、C++,熟悉CUDA编程,具备扎实的算法和数据结构基础 3、深度学习基础:深入理解深度学习原理,熟练使用PyTorch等主流框架,熟悉模型量化技术(INT8、FP16、混合精度等) 4、系统能力:了解计算机系统架构,具备基本的性能分析和调优能力,熟悉KV-cache优化等技术 …
工作职责
专注于前沿AI模型的性能优化和推理加速,深度参与Diffusion模型、视频DiT(Diffusion Transformer)模型以及Auto-regressive模型的加速优化工作,推动AI模型在生产环境中的高效部署和应用。 核心职责: 1、模型算法与架构优化:实现模型压缩技术(量化、剪枝、蒸馏等)、开发针对特定模型架构的专用优化算法、设计高效的分布式推理架构,支持大规模并发服务 2、模型推理优化:优化视频生成DiT模型的推理效率,降低显存占用和计算延迟、研究加速Auto-regressive模型方案 3、系统工程实现:开发高性能的自定义CUDA kernel和算子,集成和优化推理框架,构建高可用的模型服务系统 4、性能调优与监控:建立模型性能基准测试体系,分析和解决推理过程中的性能瓶颈,持续优化大规模GPU集群的资源利用率
1. 参与网易伏羲游戏AI产品的质量保障,包括AIGC、自然语言、用户画像、强化学习等算法测试和性能测试; 2.对产品需求进行分析、评审,提前规避有问题需求,设计测试点、测试用例;积极发现和推动解决项目中的进度、流程、质量风险,并能对项目提出合理建议; 3. 挖掘研发和测试过程中的痛点,通过开发测试平台、工具的等方式来提升研发的质量和效率; 4. 对前沿测试技术有较高的敏感度,思考AI在测试领域的应用,能够引入并应用到工作中。
1、负责滴滴国际化外卖营销方向的需求开发,在充分理解营销业务的基础上进行需求分析、设计、开发、上线等工作; 2、负责相关核心微服务的设计和实现,充分理解业务的发展方向和未来的技术挑战,并作出提前设计和规划; 3、学习研究业界先进技术,保持技术进步。
负责AI眼镜、3D扫描重建设备、MR头显等潜在多款硬件产品研发项目全流程推进,确保项目按时保质交付。 深度对接与管理外部供应商,高质量高效率推进供应商筛选、评估与谈判,建立稳定紧密的联合研发合作。 协调内外部跨部门团队协作,包括硬件/软件/测试/工业设计/市场及售后等部门,精准将产品需求推动落地。 提前识别项目中技术/供应链/量产/市场及法规等多类风险,运用专业工具评估影响,制定并执行应对策略。 收集与分析项目关键数据,如进度/成本/质量/供应商绩效等,为项目决策和资源配置提供科学依据和有力支撑。
1、负责与销售线的协调沟通:定期与BTE和SA沟通,确保对大客户及重点项目的资源需求能够准确理解,对销售线提出的资源保障需求进行评估和反馈,提供大客户关于资源方案的咨询与支持。 2、大客户资源需求管理:协调销售线与供应链,确保大客户资源需求能准时提前报备,帮助解决资源保障问题,特别是在紧急需求或供应不足/交付延迟时,快速应对以确保项目进度。 3、大客户资源规划方案与建议:针对大客户及重点项目的资源需求,制定资源规划方案。 4、信息对齐、定期跟进:与销售线一同定期回顾大客户及重点项目的资源情况,定期回顾预测准确率、报备提前量、资源预留等重要数据。 5、数据化建设:与产研团队合作,推进大客户资源需求报备平台、大客户资源需求预测模型及画像、数据大盘等自动化、数据化系统平台建设。