vivo高性能计算专家(上海&杭州)
任职要求
1.硕士及以上学历,计算机/电子等相关专业背景; 2.深入理解数字图像处理相关算法及移动端网络部署,具有相关项目经历; 3.熟练使用C/C++和Python,良好的代码质量和风格; 4.熟悉算法优化,包括CPU、GPU或DSP等; 5.熟悉NDK、ADB、GIT等工具的使用; 6.具备良好的沟通表达能力、学习能力、团队协作能力以及抗压能力; 7.良好的英文文档阅读能力; 8.有模型训练、量化等经验者优先
工作职责
1.协同算法团队,设计适合落地部署的影像算法SDK架构; 2.充分考虑算法落地优化需求,实现算法SDK原型; 3.针对当前SDK在产品中的问题与缺陷,提出并实施对应解决方案。
1. 负责影像基础画质方向的SDK方案设计与实现,通过整合指令集优化、内部线程调度、内存池等技术最大化性能功耗使用效率; 2. 评估模块SDK的新平台可行性评估; 3. 理解系统架构、硬件架构,根据业务需求驱动厂商硬件与软件的本地化实现。
1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。
1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。
负责饿了么深度模型和超大规模训练推理,支持万亿规模的稠密及稀疏训练推理优化,结合分布式系统、高性能计算、异构计算,探索性能边界,支撑超大规模模型的训练及推理部署 我们关注超大规模模型训练及推理系统,为深度学习模型提供算力基座 岗位职责: 1、支持百亿-万亿规模的稠密模型、稀疏模型训练,在千卡集群上,实现多种分布式训练架构,以及强化学习训推一体复用等技术,消除各类大规模模型分布式训练的瓶颈 2、支持大规模深度模型的推理部署性能优化,通过高性能计算、分布式计算、异构计算、编译优化等手段,在千卡集群上,解决大尺寸模型的推理性能瓶颈 3、深入工程和算法协同,结合大规模推荐、大语言、多模态算法,探索适合业务的创新训练范式