快手AI 性能优化工程师（北京/杭州/深圳）

社招全职D71982025-04-10地点：北京状态：招聘

扫码手机上打开

任职要求

1.在图优化、量化、算子优化等技术方向其中一项有深入研究；
2.熟练掌握Python等编程语言，具备扎实的数据结构与算法能力；
3.熟悉vLLM、SGlang、Torch.compile、XLA、Triton、TensorRT、TensorRT-LLM等技术之一，并有相应开发经验者优先；
4.熟悉GPU（Nvidia/AMD）平台的高性能计算优化技术，对GPU硬件有深入理解，熟悉并行计算优化、访存优化和低比特计算等，熟悉Nsight System/ Nsight Compute 工…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.参与AI与GPU相关项目的性能优化与研发，通过利用并行计算优化、架构优化、量化优化和异构调度等高性能优化技术，研发行业领先的高性能异构AI优化技术与编译优化技术；
2.针对搜广推、音视频以及大模型场景，优化大模型训练和推理场景的性能；
3.与公司各算法部门深度合作，对重点项目进行算法与系统的联合优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

数据结构+

算法+

大模型+

vLLM+

还有更多 •••

登录查看完整学习资料

相关职位

AI性能优化工程师

校招J1020

1.参与AI与GPU相关项目的性能优化与研发，通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术，研发行业领先的高性能异构AI优化技术与编译优化技术； 2.针对搜索、推荐、广告、音视频以及大模型场景，优化模型训练和推理场景的性能； 3.与公司各算法部门深度合作，对重点项目进行算法与系统的联合优化。

更新于 2025-07-30深圳|杭州|北京

全栈研发工程师-抖音

社招2年以上A207604A

1、参与抖音研发效能平台能力的建设，负责系统设计和核心代码开发； 2、支撑抖音业务工程提效、红蓝攻防、风险治理等方向智能化建设； 3、对前端工程化体系建设、开发规范、组件化、测试有深入认识和实践； 4、对产品的稳定性和性能极致的追求，深入理解并致力于优化和重构，确保系统高效、稳定运作； 5、关注AI领域的最新动态和趋势，结合开发者的实际需求，为我们提供高性能、适应性强的技术解决方案。

更新于 2024-09-14北京

混元大模型推理研发高级工程师（深圳/北京/上海/杭州）

社招1年以上公共技术

1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统； 2.优化大模型推理性能，提升吞吐并控制成本； 3.优化大模型推理框架，提升框架易用性和可调试性。

更新于 2025-10-20深圳

AI Agent高级研发工程师-智能创作（北京/上海/杭州/深圳/广州）

社招A171311A

1、设计和实现基于LLM的智能体架构，包括任务规划、对话管理、意图识别、流程工程等； 2、设计和实现多模态Agent，支持文本、语音、图像等多种输入/输出形式的处理； 3、推动AI Agent在架构和性能上的持续优化，提升Agent对用户理解能力和响应的准确性； 4、开发和维护智能体的后端服务，确保系统的稳定性和可扩展性； 5、跟踪并研究行业前沿AI算法，持续提升AI Agent的技术水平； 6、编写必要的技术文档，包括API接口说明、核心算法设计与代码开发。

更新于 2025-01-08北京