快手大模型后端工程师-【可灵AI】
社招全职3-5年J0012地点:北京 | 深圳状态:招聘
任职要求
1、熟练掌握diffusion原理,熟悉transformer结构及其变种,掌握大模型模型特性,有过大模型训练经历,SFT经历者优先; 2、熟练掌握传统模型压缩技术,包括:模型量化,模型稀疏化(如剪枝,token-merge,token-eviction),模型蒸馏,有其中一个相关的研究经历或实践经验; 3、熟练掌握…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责可灵数字人团队生成端系统,包括技术方案设计、算法对接服务部署、业务方对接工作; 2、负责可灵数据团队内部文本及多模态大模型的推理部署效率优化需求。
包括英文材料
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
缓存+
https://hackernoon.com/the-system-design-cheat-sheet-cache
The cache is a layer that stores a subset of data, typically the most frequently accessed or essential information, in a location quicker to access than its primary storage location.
https://www.youtube.com/watch?v=bP4BeUjNkXc
Caching strategies, Distributed Caching, Eviction Policies, Write-Through Cache and Least Recently Used (LRU) cache are all important terms when it comes to designing an efficient system with a caching layer.
https://www.youtube.com/watch?v=dGAgxozNWFE
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位
社招3-5年J0012
1、配合算法同学,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2、优化大模型推理服务性能,提升吞吐并控制成本; 3、优化大模型推理服务化框架,提升框架易用性和可调试性。
更新于 2025-12-23北京
社招1-3年J0012
你将与一群“可能是行业内最顶尖的”Java后端工程师一起,共同搭建业界领先的直播平台。在这里你将: 1、参与快手直播营收系统的研发工作,深入发掘和分析业务需求,撰写技术方案和系统设计,通过敏捷开发支持产品需求快速迭代,支撑业务规模增长; 2、接受高并发、海量资金以及数据的挑战,分析和发现系统的优化点,负责推动系统易用、扩展、可用性、资金安全性、性能等提升; 3、参与直播营收业务与AI技术的深度融合,并结合业务具体场景给出工业化落地方案,提高直播流水; 4、探索AI领域最新的技术和趋势,为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。
更新于 2026-03-12北京
校招通义2026届秋
通义团队聚焦AIGC、大模型基础研究和行业应用探索,领域覆盖视觉、语音、自然语言处理、机器学习等多个领域。在这里你可以接触业界领先的AI产品和技术,深度参与Modelscope开源生态平台、DashScop灵积模型服务平台、通义AI产品的建设,探索AI+不同场景的全新交互形式,打造具有科技感、全新生产力的科技型产品。 期待您的加入,AI浪头一起弄潮,感受不一样的未来! 1. 负责AI大模型相关系统设计、开发和上线等整个项目周期内的工作。 2. 负责系统技术规划和技术前瞻布局,解决系统疑难问题。 3. 构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求。
更新于 2025-08-08北京|杭州