logo of meituan

美团基座大模型高阶算法/工程

社招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1. 对CV、NLP、多模态等相关领域有深入的理解,在其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2.  对…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。
2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。
3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。
4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。
包括英文材料
NLP+
还有更多 •••
相关职位

logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳
logo of soul
社招5年以上

1. 负责Soul社交垂域多模态基座大模型的研发和应用支撑,作为基座支持包括但不限于 多模态理解、多模态生成、多模态对话、实时双工音视频通话、多Agent对话、aigc内容供给、大模型推荐、内容理解、大模型安全等的技术探索 2. 负责Soul个性化大模型的研发,做到面向用户偏好建模的千人千面大模型,从而更适配Soul AI业务落地场景,提升业务落地效率 3. 协助建设AI中台+数据体系,沉淀技术和数据资产,赋能公司AI相关业务

更新于 2024-11-12上海|北京
logo of meituan
社招核心本地商业-基

1. 基座大模型预训练,包括但不限于不同规模、不同结构的语言模型和多模态模型的数据准备和优化、模型预训练、训练加速与框架优化等; 2. 大模型对齐技术(SFT、RLHF等)链路整体优化,包括数据探索与增强、对齐流程探索、奖励模型优化、强化学习策略迭代等,持续提升对齐效果; 3. 大模型训练和推理优化,包括但不限于高效训练技术和框架设计与实现、模型小型化技术(稀疏化、压缩、剪枝、蒸馏等)探索与落地、高效推理技术实现等; 4. 大模型相关技术前沿探索,包括但不限于Scaling Law、模型架构探索(MoE、MAMBA等)、训练范式探索、长序列技术探索、高效训推框架探索等; 5. 支撑内部应用需求,对接搜索、推荐、广告等实际业务场景,实现大模型应用落地。

更新于 2025-02-05北京|上海
logo of vivo
社招10年以上研发类

一、 1. 负责端侧基座大模型相关算法研究、重难点技术攻关,下游应用场景包括面向手机场景的文本、多模态内容生成和理解任务(智能手机助手、UI-Agent等)。 2. 跟进业界最新的文本、多模态预训练、强化学习、推理增强模型相关技术和方法,根据公司内重点业务场景的需求,研发行业领先的原创性算法,提供行业领先的端侧基座模型。 3. 顶会论文发表,对外技术分享,提高团队整体技术影响力。 二、

更新于 2025-10-27深圳