logo of baidu

百度AIGC算法工程师-多模态理解方向(J84779)

实习兼职MEG地点:北京状态:招聘

任职要求


-计算机科学、人工智能或相关领域在读硕士或博士,博士优先
-对深度学习、多模态模型、图像编辑或视频理解等技术有浓厚兴趣
-具备基本…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-协助团队进行多模态大模型相关研究,包括高效微调、多模态理解对齐、玩法开发、幻觉消除、数据治理部署优化等相关工作
-参与项目的算法验证和优化,确保算法的效率和准确性
-协助进行文献调研,总结最新的技术趋势和研究进展
-参与团队内部的技术交流和分享会议
包括英文材料
深度学习+
算法+
还有更多 •••
相关职位

logo of youku
社招1年以上

1、多模态大模型的后训练和强化学习,完成视频描述生成,视频打标等视频理解任务; 2、建立文生图、图生图、文生视频、图生视频的质量评价标准,研发高精度的评价模型; 3、参与风险内容检测和商业化审核的算法研发工作;

更新于 2025-11-19北京
logo of xiaohongshu
校招AIGC算法

内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的工作,应用图像和NLP技术,提升发布侧基础工具效果和体验; 2、负责包括但不限于大规模预训练模型、数据挖掘,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,并负责在发布&增长等业务的落地应用。 生成方向: 1、负责多模态生成/GAN等图像生成相关算法研发与优化, 跟进计算机视觉领域的前沿技术研究; 2、参与技术规划制定, 把握图像生成技术最新发展趋势; 3、推动技术在特效/素材生成/辅助设计等领域的应用。 基础视觉方向 1、参与计算机视觉(检测、分割、人脸、人体)的前沿技术的研究和落地; 2、为小红书发布侧提供基础视觉算法能力,为更多的模版服务,提升UGC使用体验。 AIGC方向: 1、参与计算机视觉、自然语言处理、多模态等领域的前沿技术研究; 2、利用前沿AIGC算法,打造业内领先的多媒体内容理解和生成能力。

北京|上海
logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2025-09-16北京|上海
logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2025-09-16北京|上海