logo of kuaishou

快手多模态大模型预训练算法专家-【Keye】

社招全职D13360地点:北京状态:招聘

任职要求


1、硕士及以上学历,有较强的工程实现能力;
2、在大规模预训练、模型对齐、强化学习RAGAgent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
加分项:
1、在NOI、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与快手自研多模态大模型预训练算法工作,依托快手视频社区平台,构建最具影响力的多模态理解基座模型和开源生态;
2、参与多模态大模型架构探索,包括但不限于万亿级参数多模态MoE模型的训练、多模态信息编码方案设计、探索更高效的图文/视频/音频等编码方式、多模态表征学习和语义对齐策略的探索、超长上下文模型开发等;
3、参与高质量预训练数据构建,包括从但不限于大规模混合模态预训练数据构建(探索多模态Scaling)、高质量多模态语义对齐数据合成、探索模型自我迭代提升路径、感知能力专家模型研发(包括OCR、Caption、Grounding等);
4、参与生成理解统一的多模态大模型研发。
包括英文材料
学历+
强化学习+
RAG+
AI agent+
大模型+
还有更多 •••
相关职位

logo of kuaishou
实习D13918

1、依托快手视频社区平台,构建最具影响力的多模态理解基座模型和开源生态; 2、参与多模态大模型架构探索,包括但不限于万亿级参数多模态MoE模型的训练、多模态信息编码方案设计、探索更高效的图文/视频/音频等编码方式、多模态表征学习和语义对齐策略的探索、超长上下文模型开发等; 3、参与高质量训练数据构建,包括从但不限于大规模混合模态预训练数据构建(探索多模态Scaling)、高质量多模态语义对齐数据合成、探索模型自我迭代提升路径、感知能力专家模型研发(包括OCR、Caption、Grounding等); 4、协助研发理解与生成统一大模型的基础架构,涵盖多模态输入和输出在内的建模,实现模型在理解与生成任务上的协同优化效果。

更新于 2025-09-23北京
logo of alibaba
社招

1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术。 2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术。 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用。 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2025-06-10北京|杭州
logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。

更新于 2025-11-14北京
logo of kuaishou
社招D7115

1、负责快手多模态大模型预训练和对齐相关的工作,包括但不限于:多模态预训练、视觉预训练、文本预训练、多模态对齐等; 2、负责快手百亿规模多模态数据处理和清洗工作,包括图文数据、网页数据、短视频等多模态数据相关性、数据质量建设等等; 3、负责将多模态大模型落地到快手推荐、搜索、电商、商业化等应用场景,从预训练层面提升各个场景的内容理解能力; 4、负责跟进多模态大模型的前沿研究,保持部门在大模型方面的技术领先。

更新于 2025-05-22北京