快手【快Star-X】多模态算力引擎研发工程师
任职要求
1、硕士及以上学历,计算机、电子、自动化等专业优先; 2、熟悉掌握Java/Python/C++语言中的一种,有扎实的算法与数据结构基础; 3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作。 加分项:…
工作职责
1、参与多模态模型、视频生成模型等大模型的分离式推理编排、异构算力匹配、全球化计算调度; 2、参与大规模异构算力集群的算力资源池化、弹性资源混部、潮汐资源调度; 3、基于HBO、强化学习等优化算法,持续优化工业级多模态视频生成、多模态内容理解系统的耗时体验与算力消耗。
参与快手大模型推理引擎研发,工作内容包括: 1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理 2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等 3、支持RL中的多样化采样、generation性能优化等
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、深度参与业界先进开源LLM/VLM模型的推理优化部署,构建业界领先的模型推理优化能力; 2、负责完善不同芯片的推理适配和优化技术体系,提升大模型x芯片类型矩阵的适配与优化效率; 3、负责新型异构芯片在多种大模型上的分析评估工作; 4、负责前沿技术的调研评估和引进落地,例如前沿论文中的推理加速技术、软硬协同优化、新异构硬件特性等。
1. 负责大众点评信息流推荐、内容搜索、内容创作场景的内容理解、多模态大模型、内容x搜推交叉相关算法研发,包括不限于内容打标、embedding、话题推荐、标题生成、描述生成、视觉问答、内容x行为联合建模等。 2. 负责将上述技术在大众点评信息流推荐、内容搜索、内容创作等场景的落地,与产运研团队紧密协作,降低内容生产成本、提升内容分发效率,解决内容生产、分发、展示等环节的实际问题。 3. 紧密跟进生成式内容理解、多模态大模型、内容x搜推交叉等领域的前沿进展,并负责在信息流推荐、内容搜索、内容创作等业务场景的落地应用。