
奇虎36026秋-AI大模型算法工程师-OCR/多模态(北京)-4915(J11814)
校招全职算法类地点:北京状态:招聘
任职要求
1、对OCR技术、多模态解析/多模态文档视频内容理解方向有浓厚兴趣,有相关研发经验; 2、对深度学习基础理论…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责PDF/DOC文档OCR相关算法/多模态解析的研发和工程实现,并将算法应用到业务场景中; 2、跟进OCR/多模态前沿技术,包括但不限于图像文字检测、识别,多语种识别,视频文本识别,版面分析,文本属性,语义理解等相关工作,进行技术难点攻关与前瞻研究; 3、通过持续优化人工智能识别算法和机器学习模型,提升光学识别的准确度和效率,提升应用的客户感知; 4、熟悉opencv。熟悉目标检测、跟踪、识别、分割、特征点等常见的任务。熟悉常见图像操作。 5、有PDF/DOC文档识别或者多模态文档经验优先;比如有OCR或者多模态解析经验,解决过财报,报表数字识别,和表格数字识别问题经验优先。
包括英文材料
OCR+
https://www.ibm.com/think/topics/optical-character-recognition
Optical character recognition (OCR) is a technology that uses automated data extraction to quickly convert images of text into a machine-readable format.
https://www.youtube.com/watch?v=or8AcS6y1xg
Optical character recognition (OCR) is sometimes referred to as text recognition.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
还有更多 •••
相关职位
校招研发技术类
1、负责大模型相关实际应用开发与维护,包括提示词优化,检索增强,模型训练、微调部署、性能评估等工作,支持模型调度,确保模型服务运行性能和安全; 2、负责基于AI服务框架封装模型,根据实际业务场景需要,进行图像预处理,目标分割分类,内容裁切提取和修复增强等视觉融合事务; 3、负责AI知识系统建设,文件向量化与训练算法模型优化,协助AI项目技术方案设计、技术架构管理、交付实施以及相关文档编写; 4、参与数据处理过程,建立和维护数据集,制定模型训练数据标准,为AI模型的训练和优化提供高质量的数据支持; 5、参与平台大模型能力构建,跟踪调研前沿技术,推动公司AI技术创新,使相关AI技术在研发提效等业务落地并取得效益。
更新于 2025-08-18惠州

校招算法类
我们正在寻找对AI Agent技术充满热情的应届毕业生加入我们的算法团队。你将参与设计和开发下一代智能Agent系统,致力于构建能够自主决策、多轮交互和复杂任务执行的AI应用。 主要工作内容: 1.参与Agent框架的设计与优化,包括规划、记忆、工具使用等核心模块 2.开发多模态Agent系统,支持文本、图像、语音等多种输入输出形式 3.研究和实现Agent的推理链优化,提升复杂任务的执行效率 4.构建Agent评测体系,设计自动化测试和性能监控方案 5.参与Agent在垂直领域的落地应用,如代码生成、数据分析、客服等场景 6.跟踪前沿研究,将最新理论成果快速转化为产品创新
更新于 2025-09-02北京

校招算法类
1、探索AIGC领域相关算法研究和应用落地 2、根据公司业务,根据特定场景进行算法分析和优化,面向场景包括但不限于文档智能、规划、创意文案/报告生成等 3、精通自然语言处理算法,对计算机视觉/语音语义/推荐等相关模型有了解,并对多模态算法持续follow和研究
更新于 2025-09-02北京