logo of kuaishou

快手【快Star-X】GenAI异构计算架构与优化工程师

校招全职J1020地点:北京状态:招聘

任职要求


1、技术能力:
精通Linux环境下C/C++Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
包括英文材料
Linux+
C+
C+++
Python+
深度学习+
还有更多 •••
相关职位

logo of nvidia
实习

We are now looking for a GeForce/ProViz Performance Engineer Intern! This position offers the chance to create a significant impact in a dynamic, technology focused company. As a member of the Performance Lab team, you will reach firsthand GPUs and optimize performance from designing stage till whole product lifetime,  architectures to extend the state of the art in Gaming, Professional Visualization,  Cloud Gaming, Data Center efficiency and performance.  What you’ll be doing: • Identify, run graphics, studio and WinAI benchmarks across servers, PCs, workstations and laptops. • Compose competitive analysis reports for internal and external customers to position NVIDIA products appropriately using their evaluation. • Develop and maintain automation scripts for games/studio/WinAI performance and system monitoring data collection on Windows and Linux to speed up providing business and engineering insights. • Develop, implement and maintain tools to improve testing efficiency.

更新于 2025-11-14上海
logo of vivo
社招7年以上产品运营类

1、根据多视角的洞察分析,结合公司战略,制定手机产品策略和卖点方向,确保产品竞争力,重点需要较强的策略洞察和分析能力,支撑P+3工作; 2、产品规划及定义,输出产品任务书,保证产品竞争力及产品目标在项目中的实现; 3、整合营销,把控营销方向,保证产品调性及产品核心利益点的传播; 4、产品操盘,参与产品销售策略制定,保证产品全生命周期良好的损益及销售目标达成; 5、对行业敏感,对于产品体验有高追求,具有良好用户思维,不断推动产品及体验优化。

东莞
logo of tencent
社招3年以上TEG技术

1.参与具身智能平台的系统架构设计和模块研发工作,支持将实验室算法和数据的能力开放,提供稳定高效和安全的服务; 2.参与建设具身智能仿真平台,支持多模态感知、决策规划、运动操作、人机交互等相关算法能力的迭代优化; 3.参与构建云边协同体系,安全防护体系,以及资源的调配优化能力; 4.参与建设机器人社区生态,包括开发者工具套件、技术论坛、资源共享中心等。

更新于 2025-06-12深圳
logo of tencent
社招TEG产品

1.深入理解具身智能开放平台算法模型以及提供的技术服务,面向机器人行业开发者推广并跟进开发者使用效果;组织面向开发者的各类活动,提升平台用户覆盖和活跃; 2.面向具身智能领域开发者群体运营,针对开发者关于具身智能相关算法、数据集、仿真环境等相关技术问题提供技术支持,维护开发者关系; 3.与研发团队保持紧密协作,及时传递市场需求与客户反馈,驱动产品持续迭代与优化。

更新于 2025-05-29深圳