logo of baidu

百度视觉-多模态生成算法工程师-2026AIDU(J85298)

校招全职AIDU项目地点:北京 | 上海 | 深圳状态:招聘

任职要求


-有推进人工智能的理想和使命感 ;
-计算机科学、电子工程、数学等相关专业硕士及以上学历,面向26届毕业生;
-熟悉 Python 编程语言,熟悉PyTorch/Paddle/TensorFlow/MXNet等框架之一;
-熟悉常见的计算机视觉生成算法,对图像生成、图像编辑、风格迁移、视频生成、3D生成、数字人等方向有浓厚兴趣,并有一定的项目经验;
-具备良好的学习能力和团队合作精神,能够积极主动地解决问题;
-在CVPRICCVECCVICMLNeurIPS、COLT等计算机视觉机器学习学术会议或期刊以第一作者发表过文章、有丰富项目经验优先。

工作职责


-参与图像生成、图像编辑、风格迁移、视频生成、3D生成、数字人等视觉生成算法的研究与开发;
-阅读相关领域论文,复现和改进现有算法;
-参与算法模型的训练、优化和部署;
-与团队成员紧密合作,共同推进项目进展。
包括英文材料
学历+
Python+
PyTorch+
PaddlePaddle+
TensorFlow+
OpenCV+
算法+
CVPR+
ICCV+
ECCV+
ICML+
NeurIPS+
机器学习+
相关职位

logo of baidu
校招AIDU项目

多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。

更新于 2025-05-19
logo of baidu
校招AIDU项目

-应用多模态生成场景,包括识图、视觉检索、图文问答以及AI解题。

更新于 2025-05-19
logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-06-23
logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-05-19