logo of kuaishou

快手【快Star-X】GenAI异构计算架构与优化工程师

校招全职J1020地点:北京状态:招聘

任职要求


1、技术能力:
精通Linux环境下C/C++Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、模型训练/推理优化经验者优先。
2、经验背景:
在AI芯片评估、模型优化、高性能计算等领域有实际项目经验。
有顶级会议(ASPLOS、ISCA、MLSys等)论文发表或AI编译器技术(MLIR、TVM等)研究经验者优先。
3、综合素质:
具备优秀的算法思维、系统架构设计能力与工程实现能力。
对AI技术前沿有强烈兴趣,能快速学习并解决复杂技术问题。

工作职责


1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
包括英文材料
Linux+
C+
C+++
Python+
深度学习+
TensorFlow+
PyTorch+
CUDA+
算法+
系统设计+
相关职位

logo of vivo
社招7年以上产品运营类

1、根据多视角的洞察分析,结合公司战略,制定手机产品策略和卖点方向,确保产品竞争力,重点需要较强的策略洞察和分析能力,支撑P+3工作; 2、产品规划及定义,输出产品任务书,保证产品竞争力及产品目标在项目中的实现; 3、整合营销,把控营销方向,保证产品调性及产品核心利益点的传播; 4、产品操盘,参与产品销售策略制定,保证产品全生命周期良好的损益及销售目标达成; 5、对行业敏感,对于产品体验有高追求,具有良好用户思维,不断推动产品及体验优化。

logo of tencent
社招3年以上TEG技术

1.参与具身智能平台的系统架构设计和模块研发工作,支持将实验室算法和数据的能力开放,提供稳定高效和安全的服务; 2.参与建设具身智能仿真平台,支持多模态感知、决策规划、运动操作、人机交互等相关算法能力的迭代优化; 3.参与构建云边协同体系,安全防护体系,以及资源的调配优化能力; 4.参与建设机器人社区生态,包括开发者工具套件、技术论坛、资源共享中心等。

更新于 2025-06-12
logo of tencent
社招TEG产品

1.深入理解具身智能开放平台算法模型以及提供的技术服务,面向机器人行业开发者推广并跟进开发者使用效果;组织面向开发者的各类活动,提升平台用户覆盖和活跃; 2.面向具身智能领域开发者群体运营,针对开发者关于具身智能相关算法、数据集、仿真环境等相关技术问题提供技术支持,维护开发者关系; 3.与研发团队保持紧密协作,及时传递市场需求与客户反馈,驱动产品持续迭代与优化。

更新于 2025-05-29
logo of vivo
社招营销类

海外X系列企划专家/高级经理 【】 1. 负责海外旗舰新品整合营销策略方案制定,基于大盘/竞品/用户/场景需求等输出本代策略及核心打法,牵引区域IMC方案的制定与拆解; 2. 负责海外中台核心产品/IP专项的策略制定及落地,整合拉通海外各区域诉求,统筹国内外传播资源,确保执行高效性与大海外信息一致性; 3. 负责海外中台品牌交付产出,整合拉通品牌内部Creative, Digital, PR等各维度,管理上市产品项目进度和内容质量 4. 负责区域重点国家/市场项目落地跟进; 5. 负责区域专业维度整合营销能力提升培训和支持 【