logo of baidu

百度视觉-多模态理解算法工程师-2026AIDU(J85299)

校招全职AIDU项目地点:北京 | 上海 | 深圳状态:招聘

任职要求


-有推进人工智能的理想和使命感;
-掌握计算机视觉图像处理算法、常用深度学习算法,并在如下一个或多个相关方向有深入研究:多模态模型训练、文档多模态、开放域目标检测、模型压缩小型化等;
-熟悉掌握C/C++脚本语言编程(如PythonShell等)、常用深度学习框架(例如:PytorchPaddlePaddle);
-具有良好的沟通能力,和良好的团队合作精神;
-具有从事相关视觉、多模态算法研发经验,有丰富的产品系统落地经验;
-在国际顶会或期刊(例如:CVPR, ICCV, ECCV, NIPS, ICML, AAAI, TPAMI, IJCV等)发表过论文者优先。

工作职责


-负责百度视觉感知、多模态理解模型研发,协助改进产品、落地算法应用;
-研发方向包括但不限于:视觉感知算法、多模态理解模型、模型压缩轻量化应用等;
-负责相关算法技术研发、应用工作;
-负责前沿算法的调研和研究。
包括英文材料
OpenCV+
图像处理+
算法+
深度学习+
C+
C+++
脚本+
Python+
Bash+
PyTorch+
PaddlePaddle+
CVPR+
ICCV+
ECCV+
ICML+
相关职位

logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-06-23
logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-05-19
logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-10-15
logo of baidu
校招AIDU项目

-研发突破性多模态大模型架构,探索视觉-语言-语音-3D跨; -优化大模型训练策略,攻克模态对齐、知识蒸馏、强化学习等技术难题; -推动前沿技术产品化落地,在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验; -持续跟踪ICLR/NeurIPS/CVPR等顶会最新进展,保持技术领先性; -深入挖掘产品潜在价值和需求,通过技术创新推动产品成长。

更新于 2025-05-19