logo of kuaishou

快手【快Star-X】GenAI异构计算架构与优化工程师

校招全职J1020地点:北京状态:招聘

任职要求


1、技术能力:
精通Linux环境下C/C++Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
包括英文材料
Linux+
C+
C+++
Python+
深度学习+
还有更多 •••
相关职位

logo of eleme
社招3年以上技术类-算法

1. 负责淘宝闪购营销算法,包括平台补贴定价、商家智能营销、店品价格机制、商流X物流联动等; 2. 负责用户全生命周期体验与成长,促进拉新和留存; 3. 参与营销创新性算法的研究及开发工作; 4. 协同业务进行跨团队合作。

更新于 2026-03-31上海
logo of alibaba
社招3年以上技术类-前端

1.负责alibaba国际站 数字营销的前端架构设计及研发,保障系统的安全、可扩展以及质量和性能,与PD、UED、Java 工程师协作,完成设计交互实现、数据交互、动态信息展现 2.关注用户体验,与合作方一起不断改进产品的易用性;运用AI能力重塑 广告后台BP、广告前台创意 的产品形态,提升用户体验和客服效能 3.研究和探索创新的开发思路和新的前端技术,结合业务特点创新应用AI技术,解决前端团队开发过程中面临的各类问题,提升个人和团队的开发效能 4.参与跨境B类全球化创意中心的规划建设,包括可视化制作、可视化渲染、D2C、自动化审核、自动化生产、智能诊断等,推动协助相关团队并落地未来产品和系统规划

更新于 2025-04-02杭州
logo of xiaohongshu
社招3-5年大模型

【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。

更新于 2026-03-31北京|上海|杭州
logo of ctrip
社招3年以上机票业务开发

职位挑战: 1. 负责开发和优化机票的价格缓存系统,为上游众多的业务形态提供支撑;你需要对接众多的上游和高频的需求,所以你最好是一个10X工程师,或者具备10X工程师的潜质; 2. 你需要用最低的成本提供最多的覆盖和最高的准确率; 3. 你需要有很强的抽象能力,以发现现有系统存在的不足; 4. 你需要有很强的跨团队解决问题的能力,这样才能推动各团队解决技术层面存在的问题;

更新于 2025-03-12北京