logo of kuaishou

快手多模态大模型预训练算法专家-【Keye】

社招全职D13360地点:北京状态:招聘

任职要求


1、硕士及以上学历,有较强的工程实现能力;
2、在大规模预训练、模型对齐、强化学习RAGAgent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
加分项:
1、在NOI、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与快手自研多模态大模型预训练算法工作,依托快手视频社区平台,构建最具影响力的多模态理解基座模型和开源生态;
2、参与多模态大模型架构探索,包括但不限于万亿级参数多模态MoE模型的训练、多模态信息编码方案设计、探索更高效的图文/视频/音频等编码方式、多模态表征学习和语义对齐策略的探索、超长上下文模型开发等;
3、参与高质量预训练数据构建,包括从但不限于大规模混合模态预训练数据构建(探索多模态Scaling)、高质量多模态语义对齐数据合成、探索模型自我迭代提升路径、感知能力专家模型研发(包括OCR、Caption、Grounding等);
4、参与生成理解统一的多模态大模型研发。
包括英文材料
学历+
强化学习+
RAG+
AI agent+
大模型+
还有更多 •••
相关职位

logo of kuaishou
实习D13918

1、依托快手视频社区平台,构建最具影响力的多模态理解基座模型和开源生态; 2、参与多模态大模型架构探索,包括但不限于万亿级参数多模态MoE模型的训练、多模态信息编码方案设计、探索更高效的图文/视频/音频等编码方式、多模态表征学习和语义对齐策略的探索、超长上下文模型开发等; 3、参与高质量训练数据构建,包括从但不限于大规模混合模态预训练数据构建(探索多模态Scaling)、高质量多模态语义对齐数据合成、探索模型自我迭代提升路径、感知能力专家模型研发(包括OCR、Caption、Grounding等); 4、协助研发理解与生成统一大模型的基础架构,涵盖多模态输入和输出在内的建模,实现模型在理解与生成任务上的协同优化效果。

更新于 2025-09-23北京
logo of alibaba
社招

1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术。 2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术。 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用。 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2025-06-10北京|杭州
logo of dewu
社招技术类

1、深入理解电商平台业务场景,负责自然语言处理(NLP)、语义分析、人机对话模型等核心算法的研究与实现; 2、基于电商业务场景数据,重点负责大模型后训练算法,以及策略优化等相关工作; 3、负责搭建和优化Agentic系统,挑战将前沿Agent架构和算法应用于大规模电商核心业务,打开业务增长空间。 4、跟踪行业前沿技术,探索Agentic RL、DeepSearch、高效大模型等技术,参与新一代基座模型的调优与创新。

更新于 2026-01-08上海|北京
logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。

更新于 2025-11-14北京