英伟达Perf Engineering Intern - 2026
任职要求
• Pursuing BS in Computer Science or similar computer discipline • Working knowledge of all Windows operating systems • Linux and Windows knowledge. • Good knowledge of PC systems and components. • Good organizational, time management and task prioritization skil…
工作职责
Have you ever wanted to join a groundbreaking company that is crafting the future of the tech industry? Are you a creative individual with an analytical attitude and a real passion for technology? If this sounds like you then we want to hear from you. We are looking for a dedicated team member to be part of our Performance Lab team to build and improve the work class lab. What you’ll be doing: • Candidate will create, tune, run and analyze graphics and systems benchmarks on PCs, workstations and laptops. Tasks may include some scripting to automate current test processes and benchmarks for improved efficiency. • Candidate may also need to configure computer systems with appropriate hardware and software to run benchmarks on various systems. They would run benchmarks on these systems. • Candidate would analyze results from benchmark runs and create reports to position NVIDIA products appropriately using their evaluation.
-数据库质量保证策略设计 -基于数据库内核架构(如事务引擎、存储管理、并发控制等),设计覆盖功能、性能、稳定性、安全性和灾难恢复的综合性测试策略 -针对极端场景(如硬件故障、网络分区、超大规模数据压力)和大事务/高并发场景,构建破坏性测试和压力测试模型 -测试用例开发 -编写自动化测试脚本(如Python/Perl/Shell/C++),覆盖SQL语法、事务隔离级别、锁机制、备份恢复等核心功能 -自动化测试工具以及测试用例管理平台的开发和管理工作。 使用各种测试工具和技术,自动化测试,记录和分析测试结果,并跟踪和验证缺陷 -编写测试报告和文档: 清晰准确地记录测试过程、结果和分析,编写测试报告和相关文档 -设计复杂场景测试用例,例如:极端压力测试:模拟百万级并发事务、TB级数据量下的系统稳定性;破坏性测试:强制断电、磁盘I/O错误注入、内存溢出等异常场景;边界条件测试:验证索引深度、页分裂、日志写满等临界值场景 -性能分析与调优 -使用工具(如sysbench、tpcc、tpch、自定义基准测试)分析查询执行计划、锁竞争、I/O瓶颈 -结合内核日志(如InnoDB redo log、PostgreSQL WAL)定位性能问题,推动优化方案落地 -缺陷管理与协作 -搭建测试环境(含多节点集群、混合负载),复现并跟踪内核级Bug(如死锁、数据不一致) -与开发团队紧密合作,提供Root Cause Analysis(RCA)支持,参与代码审查,提供测试反馈,协助开发人员定位和修复问题,推动内核代码修复 -技术预研与创新 -探索新技术(如向量化查询、持久内存、分布式事务)的测试方法 -开发定制化测试工具(如混沌工程平台、自动化故障注入系统)
1、负责安卓系统底层模块的开发与性能优化,包括但不限于进程/线程调度、内存管理、JNI/NDK交互、Binder机制等核心机制; 2、深入分析并解决系统级稳定性问题(ANR/崩溃/死锁/内存泄漏),建立长效监控与优化方案; 3、主导高性能多媒体框架开发,优化图片(Bitmap/JNI解码)与视频(MediaCodec/FFmpeg)编解码管线; 4、参与渲染管线优化(SurfaceFlinger/OpenGL ES/Vulkan),实现复杂动画效果的流畅渲染; 5、开发C++ Native层核心组件,进行跨平台库的调试与性能调优(Perf/ASan/Valgrind); 6、针对低端设备进行深度性能适配,优化系统资源竞争与功耗表现;
1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。