快手AI推理系统开发实习生
任职要求
1、计算机相关专业,熟悉Linux开发环境,熟练掌握 C++/Python编程语言,熟悉常见算法与数据结构; 2、熟悉深度学习相关基础知识,了解Transformer类网…
工作职责
1、参与研发业内领先的低延迟、高吞吐的大模型推理优化方案,优化目标包括视频生成大模型、多模态大模型、语言大模型等; 2、参与调研并复现大模型推理优化方向最新论文,具体方向包括高性能算子开发、大模型量化、分布式大模型并行推理等; 3、参与组内服务化框架开发,提升大模型服务部署效率。
1、参与研发业内领先的低延迟、高吞吐的大模型推理优化方案,优化目标包括视频生成大模型、多模态大模型、语言大模型等; 2、参与调研并复现大模型推理优化方向最新论文,具体方向包括高性能算子开发、大模型量化、分布式大模型并行推理等; 3、参与组内服务化框架开发,提升大模型服务部署效率。
1)构建数据库内AI推理系统架构,高效整合CPU,GPU等资源,设计数据迁移管理机制,优化模型(包括大模型和小模型)的核心性能指标; 2)研发具备负载自适应能力的推理框架,开发高精度指标采集模块,实现基于实时负载特征的动态参数调优功能; 3)研究在精度可接受范围内,多种近似推理及轻量化技术,包括采用模型压缩(如量化、剪枝)或近似算法(如近似最近邻搜索)降低计算开销。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、参与服务端架构设计和开发,为亿级用户提供优质顺畅的信息服务和极致体验; 2、参与设计系统技术方案,代码开发和系统调优; 3、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 4、参与各专项技术调研,新技术引入等前瞻项目; 5、参与大模型相关前沿业务系统研发。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、参与服务端架构设计和开发,为亿级用户提供优质顺畅的信息服务和极致体验; 2、参与设计系统技术方案,代码开发和系统调优; 3、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 4、参与各专项技术调研,新技术引入等前瞻项目; 5、参与大模型相关前沿业务系统研发。