美团多模态算法工程师
社招全职核心本地商业-业务研发平台地点:北京状态:招聘
任职要求
1. 对大模型以及智能体技术和应用有浓厚兴趣和较强的自我驱动力,能够主动分析解决问题; 2. 有基于PyTorch等深度学习框架以及Megatron等分布式框架的实战项目经验,具有较强的编程能力; 3. 具有扎实的算法理论基础,熟悉主流大模型以及多模态模型,对模型背后的原理和各自适用场景有一定的理解; 4. 深入理解模型后训练技术(如对比学习、掩码建模)、多模态对齐策略(如跨模态注意力)、端到端训练及生成模型(如Di…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责多模态大模型(文本、图像、视频、音频等)在AI搜索等方向的算法研究、设计与开发,推动模型在理解、生成、推理等任务上的性能突破。 2. 探索多模态后训练、对齐等核心技术,优化模型训练效率及跨模态任务泛化能力,以及场景应用的泛化能力; 3. 构建高质量离线多模态数据,设计数据增强及清洗策略,提升模型训练与应用服务效果; 4. 跟踪学术界与工业界最新进展,推进技术创新并形成技术前沿迭代机制,服务美团场景用户。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
还有更多 •••
相关职位
社招3年以上核心本地商业-点
1.利用计算机视觉和人工智能技术,改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM,LLM,VLM等相关算法前沿,应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线,全面参与并推动各环节的高效运行,以实现持续的业务价值提升。 5.研究并开发智能Agent系统,优化用户与AI系统的交互体验。
更新于 2025-12-02北京|上海
社招3-5年算法开发岗
1. 构建基于计算机视觉 + VLM/MLLM 的容器与商品语义理解体系,融合图像、点云与文本信息,提高复杂 SKU 识别与定位鲁棒性。 2. 设计检测/分割 + 3D 点云融合网络,实现多品混放场景的实例分割与 6D 抓取点预测。 3. 对 LLaVA、Qwen2-VL、InternVL2.5 等多模态大模型进行指令微调,支持机器人自然语言任务下达与动态规划。 4. 负责相机、雷达联合标定,多传感器融合(RGB-D + 点云 + 力矩传感器)。 5. 搭建自动标注与主动学习流水线,建设数据飞轮。 6. 关注行业最新多模态技术,快速验证并落地仓储场景。
更新于 2025-06-10北京
社招TEG技术
1.负责垂直场景多模态大模型研发,包括图文、视频、音频等多个模态的预训练和SFT训练,探索合成数据在多模态训练上的应用; 2.负责大模型安全、内容治理、电商等多场景业务的内容理解,包括多模态表征、图文/视频意图理解、相同/相似判断、自动问答等; 3.负责跟踪和研究大模型前沿问题,并应用于解决实际的业务痛点。
更新于 2025-04-16北京