logo of meituan

美团多模态算法工程师

社招全职核心本地商业-业务研发平台地点:北京状态:招聘

任职要求


1. 对大模型以及智能体技术和应用有浓厚兴趣和较强的自我驱动力,能够主动分析解决问题;

2. 有基于PyTorch深度学习框架以及Megatron等分布式框架的实战项目经验,具有较强的编程能力; 

3. 具有扎实的算法理论基础,熟悉主流大模型以及多模态模型,对模型背后的原理和各自适用场景有一定的理解;

4. 深入理解模型后训练技术(如对比学习、掩码建模)、多模态对齐策略(如跨模态注意力)、端到端训练及生成模型(如Di…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责多模态大模型(文本、图像、视频、音频等)在AI搜索等方向的算法研究、设计与开发,推动模型在理解、生成、推理等任务上的性能突破。

2. 探索多模态后训练、对齐等核心技术,优化模型训练效率及跨模态任务泛化能力,以及场景应用的泛化能力;

3. 构建高质量离线多模态数据,设计数据增强及清洗策略,提升模型训练与应用服务效果;

4. 跟踪学术界与工业界最新进展,推进技术创新并形成技术前沿迭代机制,服务美团场景用户。
包括英文材料
大模型+
PyTorch+
深度学习+
Megatron+
还有更多 •••
相关职位

logo of meituan
社招3年以上核心本地商业-点

1.利用计算机视觉和人工智能技术,改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM,LLM,VLM等相关算法前沿,应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线,全面参与并推动各环节的高效运行,以实现持续的业务价值提升。 5.研究并开发智能Agent系统,优化用户与AI系统的交互体验。

更新于 2025-12-02北京|上海
logo of jd
社招3-5年算法开发岗

1. 构建基于计算机视觉 + VLM/MLLM 的容器与商品语义理解体系,融合图像、点云与文本信息,提高复杂 SKU 识别与定位鲁棒性。 2. 设计检测/分割 + 3D 点云融合网络,实现多品混放场景的实例分割与 6D 抓取点预测。 3. 对 LLaVA、Qwen2-VL、InternVL2.5 等多模态大模型进行指令微调,支持机器人自然语言任务下达与动态规划。 4. 负责相机、雷达联合标定,多传感器融合(RGB-D + 点云 + 力矩传感器)。 5. 搭建自动标注与主动学习流水线,建设数据飞轮。 6. 关注行业最新多模态技术,快速验证并落地仓储场景。

更新于 2025-06-10北京
logo of tencent
社招TEG技术

1.负责垂直场景多模态大模型研发,包括图文、视频、音频等多个模态的预训练和SFT训练,探索合成数据在多模态训练上的应用; 2.负责大模型安全、内容治理、电商等多场景业务的内容理解,包括多模态表征、图文/视频意图理解、相同/相似判断、自动问答等; 3.负责跟踪和研究大模型前沿问题,并应用于解决实际的业务痛点。

更新于 2025-04-16北京
logo of tencent
社招TEG技术

1.负责垂直场景多模态大模型研发,包括图文、视频、音频等多个模态的预训练和SFT训练,探索合成数据在多模态训练上的应用; 2.负责大模型安全、内容治理、电商等多场景业务的内容理解,包括多模态表征、图文/视频意图理解、相同/相似判断、自动问答等; 3.负责跟踪和研究大模型前沿问题,并应用于解决实际的业务痛点。

更新于 2025-04-16深圳