美团【LongCat大模型人才校招】多模态交互算法研究员
校招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘
任职要求
1.计算机、人工智能等相关专业硕士/博士学位,具备扎实的视觉、语音和深度学习学习理论功底; 2.在 NeurIPS / ICLR / ACL / CVPR / ICCV / ICAS…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
LongCat 是美团基础研发自主研发的大模型,覆盖语言、视觉、语音、具身全栈。LongCat 相继推出 LongCat-Flash、LongCat-Flash-Thinking、LongCat-Flash-Omni 等系列模型,正在构建多模态实时交互大模型。加入团队你将参与如下工作 1. 多模态实时表征探索,研究视频与语音的视觉表征、Audio 表征以及底层模型结构,构建支撑双工交互的感知底座,攻克实时性与表达力的平衡。 2. 全模态模型结构与训练策略,探索统一的模型架构与训练范式,使模型能够充分融合视觉、语音、文本的理解与生成能力,逼近全模态统一智能。 3. 实时交互核心算法,研发面向人机自然对话的打断、判停与时机决策机制,让模型在复杂声学与多说话人场景下做到自然不抢话、不漏话、在恰当时机主动发起交互。 4. 下一代交互范式探索,研究交互式思考 模型、流式工具调用等前沿能力,定义下一代多模态实时交互大模型的形态边界。 【为什么是我们】 1.全栈顶配算力支持,依托美团大规模算力集群,提供千卡至万卡级算力支持,具备成熟的分布式训练与低延迟推理优化栈,保障 世界动作模型与 VLA 大规模训练。 2.与优秀人才同行,你将与行业顶尖的大模型研究员及机器人领域专家并肩作战,共同攻克具身智能的技术难点。
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
NeurIPS+
https://neurips.cc/
ICLR+
https://iclr.cc/
还有更多 •••