logo of kuaishou

快手编译器开发工程师

社招全职3-5年J0012地点:北京 | 深圳 | 上海 | 杭州状态:招聘

任职要求


1、精通 C/C++/Python,具备扎实的系统工程能力;
2、熟悉 Bazel、Blade 等构建工具,了解 ccache、distcc 等加速方案;
3、熟悉 LLVM/GCC 编译体系,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【关于我们】
系统软件中心是公司核心的技术引擎,是公司传统软件和大模型软件承上启下的关键一层,拥有最先进的算力与最新的软件体系;
我们不仅深耕 JVM/JDK、编译器、构建系统等传统系统软件核心能力,还全面打造 AI Infra:大模型训练、推理引擎,为公司各业务线提供高速、稳定、可扩展、低成本的大模型训练与推理服务;
在这里,你将参与推动分布式训练、强化学习(RL)、微调(SFT)、算子优化、混合精度与量化加速、KV Cache 管理、推理调度与 Pipeline 优化等前沿技术落地,让训练更快、推理更省、交付更稳;
加入我们,你将站在技术最前沿,用最先进的软件与算力,打造支撑数万亿参数模型的工业级生产系统,推动公司业务突破。

【职位描述】
1、负责公司 C/C++ 自研编译构建系统 的维护与持续演进,提升构建效率与稳定性;
2、负责 C/C++ 编译工具链(LLVM/GCC 相关) 的维护、升级与问题定位;
3、优化构建链路性能,推进 分布式构建、编译缓存(ccache)、分布式编译(distcc) 等能力落地;
4、建设编译与构建可观测、诊断能力,快速定位编译/链接/ABI 等复杂问题;
5、支撑 AI Infra 工程,优化 CUDA/异构算子相关编译流程,提升训练与推理交付效率。
包括英文材料
C+
C+++
Python+
还有更多 •••
相关职位

logo of liauto
校招算法与软件

1. 参与自研AI芯片异构编程模型、编程语言、芯片编译器、芯片编译工具链及AI编译器的设计、开发; 2. 协助负责AI模型性能分析和优化,分析性能瓶颈,改进编译优化算法,不断优化编译器; 3. 参与芯片的软硬件协同设计,编写硬件ISA标准、ABI、以及编译器后端指令集定义和代码生成; 4. 参与基于NPU加速芯片的软件栈构建自动化模型推理、模型编译、模型部署、模型发布平台;不限于异构编译、异构部署、模型训练和推理; 5. 积极跟踪编译器及编译工具链相关技术发展,探索新技术应用到实际产品中的可行性。

上海
logo of liauto
校招算法与软件

为理想汽车AI芯片研发数据流图算融合编译器,将自动驾驶端到端模型、大语言模型等业内前沿算法高效映射到NPU作推理或训练。

北京
logo of liauto
校招算法与软件

为理想汽车AI芯片研发数据流图算融合编译器,将自动驾驶端到端模型、大语言模型等业内前沿算法高效映射到NPU作推理或训练。

杭州
logo of liauto
校招算法与软件

为理想汽车AI芯片研发数据流图算融合编译器,将自动驾驶端到端模型、大语言模型等业内前沿算法高效映射到NPU作推理或训练。

上海