快手【快Star-X】GenAI异构计算架构与优化工程师
任职要求
1、技术能力: 精通Linux环境下C/C++和Python开发,扎实的计算机体系结构、操作系统、编译原理基础。 深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。 熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。 具备高性能算子开发、…
工作职责
1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。 2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。 3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。 4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。 5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
We are now looking for a GeForce/ProViz Performance Engineer Intern! This position offers the chance to create a significant impact in a dynamic, technology focused company. As a member of the Performance Lab team, you will reach firsthand GPUs and optimize performance from designing stage till whole product lifetime, architectures to extend the state of the art in Gaming, Professional Visualization, Cloud Gaming, Data Center efficiency and performance. What you’ll be doing: • Identify, run graphics, studio and WinAI benchmarks across servers, PCs, workstations and laptops. • Compose competitive analysis reports for internal and external customers to position NVIDIA products appropriately using their evaluation. • Develop and maintain automation scripts for games/studio/WinAI performance and system monitoring data collection on Windows and Linux to speed up providing business and engineering insights. • Develop, implement and maintain tools to improve testing efficiency.
1、根据多视角的洞察分析,结合公司战略,制定手机产品策略和卖点方向,确保产品竞争力,重点需要较强的策略洞察和分析能力,支撑P+3工作; 2、产品规划及定义,输出产品任务书,保证产品竞争力及产品目标在项目中的实现; 3、整合营销,把控营销方向,保证产品调性及产品核心利益点的传播; 4、产品操盘,参与产品销售策略制定,保证产品全生命周期良好的损益及销售目标达成; 5、对行业敏感,对于产品体验有高追求,具有良好用户思维,不断推动产品及体验优化。
1.参与具身智能平台的系统架构设计和模块研发工作,支持将实验室算法和数据的能力开放,提供稳定高效和安全的服务; 2.参与建设具身智能仿真平台,支持多模态感知、决策规划、运动操作、人机交互等相关算法能力的迭代优化; 3.参与构建云边协同体系,安全防护体系,以及资源的调配优化能力; 4.参与建设机器人社区生态,包括开发者工具套件、技术论坛、资源共享中心等。