百度多模态算法工程师（J83376）

社招全职TPG2025-03-21地点：北京 | 上海 | 深圳状态：招聘

扫码手机上打开

任职要求

-掌握多模态和计算机视觉算法，并在如下一个或多个相关方向有深入研究：多模态大模型、开放域目标检测、大模型小型化等
-熟悉掌握C/C++、脚本语言编程(如Python、Shell等)、常用深度学习框架（例如：PaddlePaddle等）
-具…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

-从事文本-图像、文本-视频等多模态算法研发和优化，研发业界领先、世界一流的多模态技术
-推进多模态内容理解、多模态内容生成等前沿多模态技术的创新落地，提升应用效果和性能
-负责多模态技术产品、系统的研发工作，满足百度重点产品业务的规模化使用需求
-以行业领先为目标，将技术创新推向亿万用户

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

OpenCV+

算法+

大模型+

C+

C+++

脚本+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

多模态算法工程师

社招3年以上核心本地商业-点

1.利用计算机视觉和人工智能技术，改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM，LLM，VLM等相关算法前沿，应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线，全面参与并推动各环节的高效运行，以实现持续的业务价值提升。 5.研究并开发智能Agent系统，优化用户与AI系统的交互体验。

更新于 2025-12-02北京|上海

多模态算法工程师

社招3-5年算法开发岗

1. 构建基于计算机视觉 + VLM/MLLM 的容器与商品语义理解体系，融合图像、点云与文本信息，提高复杂 SKU 识别与定位鲁棒性。 2. 设计检测/分割 + 3D 点云融合网络，实现多品混放场景的实例分割与 6D 抓取点预测。 3. 对 LLaVA、Qwen2-VL、InternVL2.5 等多模态大模型进行指令微调，支持机器人自然语言任务下达与动态规划。 4. 负责相机、雷达联合标定，多传感器融合（RGB-D + 点云 + 力矩传感器）。 5. 搭建自动标注与主动学习流水线，建设数据飞轮。 6. 关注行业最新多模态技术，快速验证并落地仓储场景。

更新于 2025-06-10北京

多模态算法工程师

社招TEG技术

1.负责垂直场景多模态大模型研发，包括图文、视频、音频等多个模态的预训练和SFT训练，探索合成数据在多模态训练上的应用； 2.负责大模型安全、内容治理、电商等多场景业务的内容理解，包括多模态表征、图文/视频意图理解、相同/相似判断、自动问答等； 3.负责跟踪和研究大模型前沿问题，并应用于解决实际的业务痛点。

更新于 2025-04-16北京

多模态算法工程师

社招TEG技术

更新于 2025-04-16深圳