logo of vivo

vivo高性能计算工程师/专家

社招全职5-15年研发类地点:杭州状态:招聘

任职要求


1. 本科及以上学历,微电子/计算机/电子等相关专业本科及以上学历背景,熟悉计算机体系结构知识;
2. 精通C/C++面向对象编程,熟悉图像处理计算机视觉相关知识;
3. 熟悉DSP指令集加速,有相关项目经验者优先;
4. 熟悉 CPU,GPU 或者 AI 加速器的硬件架构,有ARM、NEON、DSP或GPU opencl编程经验者优先;
5. 有较好的英文读写能力;
6. 具备较强的团队协作能力、沟通能力、责任意识,有大团队开发协作经验者优先。
7.  CPU/GPU/DSP/NPU等多元化计算架构的编译系统开发、实现编译优化和算法加速领域有开发经验优先;
8. 发表过高水平的性能优化或者编译技术等相关学术论文/专利者优先;

工作职责


1. 负责影像基础画质方向的SDK方案设计与实现,通过整合指令集优化、内部线程调度、内存池等技术最大化性能功耗使用效率;
2. 评估模块SDK的新平台可行性评估;
3. 理解系统架构、硬件架构,根据业务需求驱动厂商硬件与软件的本地化实现。
包括英文材料
学历+
C+
C+++
图像处理+
OpenCV+
OpenCL+
算法+
相关职位

logo of vivo
社招3年以上研发类

1、负责手机Camera相关算法的研发与应用; 2、负责算法的设计、实现及移植,并测试调试。

logo of tencent
社招5年以上CSIG技术

1.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优; 2.针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 4.与算法训练团队协作,解决分布式推理下模型并行(Model Parallelism)、数据并行(Data Parallelism)等场景下的性能瓶颈问题; 5.探索前沿技术方向(如混合专家模型MoE、动态计算图优化等),推动AI工程化落地的效率提升。

更新于 2025-09-04
logo of xpeng
社招

负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。

更新于 2025-07-08
logo of baidu
社招ACG

-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持AIGC、智算中心、金融、 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -在自研芯片上适配常见大模型,结合深度学习训推框架特性,开发或调优相关算子,提升模型在芯片上的性能和精度表现,辅助客户进行芯片选型和应用 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力

更新于 2025-05-15