logo of kuaishou

快手大模型后端工程师-【可灵AI】

社招全职3-5年J0012地点:北京 | 深圳状态:招聘

任职要求


1、熟练掌握diffusion原理,熟悉transformer结构及其变种,掌握大模型模型特性,有过大模型训练经历,SFT经历者优先;
2、熟练掌握传统模型压缩技术,包括:模型量化,模型稀疏化(如剪枝,token-merge,token-eviction),模型蒸馏,有其中一个相关的研究经历或实践经验;
3、熟练掌握…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责可灵数字人团队生成端系统,包括技术方案设计、算法对接服务部署、业务方对接工作;
2、负责可灵数据团队内部文本及多模态大模型的推理部署效率优化需求。
包括英文材料
Transformer+
大模型+
SFT+
缓存+
PyTorch+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0012

1、配合算法同学,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2、优化大模型推理服务性能,提升吞吐并控制成本; 3、优化大模型推理服务化框架,提升框架易用性和可调试性。

更新于 2025-12-23北京
logo of kuaishou
社招1-3年J0012

你将与一群“可能是行业内最顶尖的”Java后端工程师一起,共同搭建业界领先的直播平台。 在这里你将: 1、参与快手直播营收系统的研发工作,深入发掘和分析业务需求,撰写技术方案和系统设计,通过敏捷开发支持产品需求快速迭代,支撑业务规模增长; 2、接受高并发、海量资金以及数据的挑战,分析和发现系统的优化点,负责推动系统易用、扩展、可用性、资金安全性、性能等提升; 3、参与直播营收业务与AI技术的深度融合,并结合业务具体场景给出工业化落地方案,提高直播流水; 4、探索AI领域最新的技术和趋势,为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。

更新于 2026-03-12北京
logo of tongyi
校招通义2026届秋

通义团队聚焦AIGC、大模型基础研究和行业应用探索,领域覆盖视觉、语音、自然语言处理、机器学习等多个领域。在这里你可以接触业界领先的AI产品和技术,深度参与Modelscope开源生态平台、DashScop灵积模型服务平台、通义AI产品的建设,探索AI+不同场景的全新交互形式,打造具有科技感、全新生产力的科技型产品。 期待您的加入,AI浪头一起弄潮,感受不一样的未来! 1. 负责AI大模型相关系统设计、开发和上线等整个项目周期内的工作。 2. 负责系统技术规划和技术前瞻布局,解决系统疑难问题。 3. 构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求。

更新于 2025-08-08北京|杭州
logo of bytedance
社招2年以上A123787

1、持续推进语音、音乐大模型最新技术的工程优化和应用落地; 2、大模型分布式推理的架构和优化,在模型高速迭代的过程中,保证架构可扩展、资源有较高利用率; 3、大模型语音服务稳定性治理,并发优化,多地域运维部署提效; 4、深入业务,全链路提升豆包等产品语音交互体验。

更新于 2025-05-07杭州