logo of vivo

vivo高性能计算专家(上海&杭州)

社招全职5年以上研发类地点:上海 | 杭州状态:招聘

任职要求


1. 本科及以上学历,微电子/计算机/电子等相关专业本科及以上学历背景,熟悉计算机体系结构知识;
2. 精通C/C++面向对象编程,熟悉图像处理计算机视觉相关知识;
3. 熟悉DSP指令集加速,有相关项目经验者优先;
4. 熟悉 CPU,GPU 或者 AI 加速器的硬件架构,有ARM、NEON、DSP或GPU opencl编程经验者优先;
5. 有较好的英文读写能力;
6. 具备较强的团队协作能力、沟通能力、责任意识,有大团队开发协作经验者优先。

工作职责


1. 负责影像基础画质方向的SDK方案设计与实现,通过整合指令集优化、内部线程调度、内存池等技术最大化性能功耗使用效率;
2. 评估模块SDK的新平台可行性评估;
3. 理解系统架构、硬件架构,根据业务需求驱动厂商硬件与软件的本地化实现。
包括英文材料
学历+
C+
C+++
图像处理+
OpenCV+
OpenCL+
相关职位

logo of vivo
社招5-15年研发类

1.协同算法团队,设计适合落地部署的影像算法SDK架构; 2.充分考虑算法落地优化需求,实现算法SDK原型; 3.针对当前SDK在产品中的问题与缺陷,提出并实施对应解决方案。

更新于 2025-07-07
logo of thead
社招5年以上技术-芯片

1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。

更新于 2025-08-27
logo of thead
社招5年以上技术-芯片

1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。

更新于 2025-09-22
logo of eleme
社招2年以上技术类-开发

负责饿了么深度模型和超大规模训练推理,支持万亿规模的稠密及稀疏训练推理优化,结合分布式系统、高性能计算、异构计算,探索性能边界,支撑超大规模模型的训练及推理部署 我们关注超大规模模型训练及推理系统,为深度学习模型提供算力基座 岗位职责: 1、支持百亿-万亿规模的稠密模型、稀疏模型训练,在千卡集群上,实现多种分布式训练架构,以及强化学习训推一体复用等技术,消除各类大规模模型分布式训练的瓶颈 2、支持大规模深度模型的推理部署性能优化,通过高性能计算、分布式计算、异构计算、编译优化等手段,在千卡集群上,解决大尺寸模型的推理性能瓶颈 3、深入工程和算法协同,结合大规模推荐、大语言、多模态算法,探索适合业务的创新训练范式

更新于 2025-09-25