logo of baidu

百度计算机视觉及多模态算法实习生(J85731)

实习兼职ACG地点:成都状态:招聘

任职要求


-本科及以上学历在校生,计算机相关专业,可尽快到岗,线下实习4个月及以上,每周至少出勤4天
-在多模态和计算机视觉某个领域有较深入的研究,包括但不限于:OpenCV、图像分类识别、图像分割、目标检测、OCR、多模态、无监督和自监督学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-参与计算机视觉、文档处理分析相关技术研发,包括但不限于OCR文字识别、文档结构化、LLM训推等任务
-参与多模态大模型的算法方案调研、日常训练、微调与效果优化,确保模型训练的稳定性和效果
-支持大模型在各种实际业务中的落地,包括但不限于信息抽取、审查、图表解析等,确保其在真实场景中的有效应用
-参与大模型的日常评估和开发工作,推动其持续改进和性能提升,提高训练和推理效率
-与团队成员紧密合作,协同解决开发过程中遇到的问题和技术挑战
包括英文材料
学历+
OpenCV+
OCR+
NLP+
还有更多 •••
相关职位

logo of kuaishou
实习D13918

1、跟进计算机视觉及多模态等前沿技术方向,能够实现前沿算法,保持算法在工业界和学术界的领先; 2、探索计算机视觉及多模态算法在内容理解和内容生成等领域的应用,参与和推动技术落地到快手各产品线,如搜索、推荐、电商、商业化等; 3、打造算法技术在工业界和学术界的影响力,参与相关专利、顶会论文的发表。

更新于 2025-07-16北京
logo of baidu
实习ACG

-参与计算机视觉、文档处理分析相关技术研发,包括但不限于OCR文字识别、文档结构化、LLM训推等任务 -参与多模态大模型的算法方案调研、日常训练、微调与效果优化,确保模型训练的稳定性和效果 -支持大模型在各种实际业务中的落地,包括但不限于信息抽取、审查、图表解析等,确保其在真实场景中的有效应用 -参与大模型的日常评估和开发工作,推动其持续改进和性能提升,提高训练和推理效率 -与团队成员紧密合作,协同解决开发过程中遇到的问题和技术挑战

更新于 2025-09-29成都
logo of netease
实习网易有道

负责智能硬件相关图像生成、多模态OCR算法训练、调优与评测; 参与多模态大模型在教育领域的研究和应用探索; 协助团队完成相关技术文档的整理与撰写。

更新于 2025-06-18北京
logo of netease
实习网易伏羲

1. 将深度学习图形图像领域技术结合游戏场景进行创新研究; 2. 负责计算机视觉/图形学相关核心技术在游戏相关领域的算法与落地应用工作,包括但不限于如下方向:3D生成,3D重建,3D人脸/头发/人体,表情/动作,渲染,蒙皮,材质等; 3. 借助游戏平台及数据推动技术前沿的发展,并且能够快速落地应用到业务中; 4. 发表高质量论文或撰写专利,提升技术影响力。

更新于 2025-04-17杭州