logo of kuaishou

快手【快Star-X】多模态数据生产引擎研发工程师

校招全职J1020地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、电子、自动化等专业优先;
2、熟悉掌握Java/Python/C++语言中的一种,有扎实的算法数据结构基础;
3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作。

加分项:
1、了解某类大模型的基础算法知识(例如LLM、VLM、Diffusion);
2、了解某种大模型推理或训练框架(例如vLLM/SGLang/PyTorch);
3、有大规模数据处理、数据检索等系统方面的实践经验。

工作职责


1、参与多模态模型、视频生成模型等大模型的全链路数据生产流水线搭建;
2、参与多模态数据处理所需的LLM/VLM模型推理、跨模态检索、跨模态对齐等工程系统的建设;
3、基于各类分布式数据处理以及推理优化技术,持续优化超大规模多模态数据处理的推理、存储以及检索效率。
包括英文材料
学历+
Java+
Python+
C+++
算法+
数据结构+
大模型+
vLLM+
PyTorch+
相关职位

logo of tencent
社招3年以上TEG技术

1.参与具身智能平台的系统架构设计和模块研发工作,支持将实验室算法和数据的能力开放,提供稳定高效和安全的服务; 2.参与建设具身智能仿真平台,支持多模态感知、决策规划、运动操作、人机交互等相关算法能力的迭代优化; 3.参与构建云边协同体系,安全防护体系,以及资源的调配优化能力; 4.参与建设机器人社区生态,包括开发者工具套件、技术论坛、资源共享中心等。

更新于 2025-06-12
logo of meituan
社招3-5年核心本地商业-点

1. 负责大众点评信息流推荐、内容搜索、内容创作场景的内容理解、多模态大模型、内容x搜推交叉相关算法研发,包括不限于内容打标、embedding、话题推荐、标题生成、描述生成、视觉问答、内容x行为联合建模等。 2. 负责将上述技术在大众点评信息流推荐、内容搜索、内容创作等场景的落地,与产运研团队紧密协作,降低内容生产成本、提升内容分发效率,解决内容生产、分发、展示等环节的实际问题。 3. 紧密跟进生成式内容理解、多模态大模型、内容x搜推交叉等领域的前沿进展,并负责在信息流推荐、内容搜索、内容创作等业务场景的落地应用。

更新于 2025-06-17
logo of kuaishou
实习J1001

1、数据特征算法方案制定与效果优化:针对不同模态、多种类目的数据,设计自动化筛选方案;对多模态数据涉及的前沿特征算法(如物体跟踪、ID 重识别、音频分离)进行场景化效果优化。与算法工程师协作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力; 2、数据 pipeline 建设:负责多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代; 3、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议,确保训练数据覆盖目标场景并满足多样性需求,最终通过数据驱动方法优化视频生成大模型效果。

更新于 2025-07-18
logo of kuaishou
校招J1007

1、负责研发业界领先的多模态理解与生成统一架构,从事基础模型预训练、监督微调、架构优化等,重点探索感知(理解)与生成能力的协同演进与边界突破; 2、研究高效建模多模态数据(图像、文本、视频等)的新范式,提升模型的信息表征、理解与联合生成能力; 3、探索并研发更高效的视觉编码器,构建更强大的多模态模型基础; 4、发表高水平学术论文和开源项目,提升团队在学术界、工业界的技术影响力。

更新于 2025-06-26