
奇虎36026秋-AI大模型算法工程师-OCR/多模态(北京)-4915(J11814)
校招全职算法类地点:北京状态:招聘
任职要求
1、对OCR技术、多模态解析/多模态文档视频内容理解方向有浓厚兴趣,有相关研发经验; 2、对深度学习基础理论和大规模实践有较深理解。 3. 精通至少一种技术语言,包括但不限于java、C/C++、C#、python等
工作职责
1、负责PDF/DOC文档OCR相关算法/多模态解析的研发和工程实现,并将算法应用到业务场景中; 2、跟进OCR/多模态前沿技术,包括但不限于图像文字检测、识别,多语种识别,视频文本识别,版面分析,文本属性,语义理解等相关工作,进行技术难点攻关与前瞻研究; 3、通过持续优化人工智能识别算法和机器学习模型,提升光学识别的准确度和效率,提升应用的客户感知; 4、熟悉opencv。熟悉目标检测、跟踪、识别、分割、特征点等常见的任务。熟悉常见图像操作。 5、有PDF/DOC文档识别或者多模态文档经验优先;比如有OCR或者多模态解析经验,解决过财报,报表数字识别,和表格数字识别问题经验优先。
包括英文材料
OCR+
https://www.ibm.com/think/topics/optical-character-recognition
Optical character recognition (OCR) is a technology that uses automated data extraction to quickly convert images of text into a machine-readable format.
https://www.youtube.com/watch?v=or8AcS6y1xg
Optical character recognition (OCR) is sometimes referred to as text recognition.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
C#+
https://learn.microsoft.com/en-us/dotnet/csharp/
The C# guide contains articles, tutorials, and code samples to help you get started with C# and the .NET platform.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
相关职位
校招研发技术类
1、负责大模型相关实际应用开发与维护,包括提示词优化,检索增强,模型训练、微调部署、性能评估等工作,支持模型调度,确保模型服务运行性能和安全; 2、负责基于AI服务框架封装模型,根据实际业务场景需要,进行图像预处理,目标分割分类,内容裁切提取和修复增强等视觉融合事务; 3、负责AI知识系统建设,文件向量化与训练算法模型优化,协助AI项目技术方案设计、技术架构管理、交付实施以及相关文档编写; 4、参与数据处理过程,建立和维护数据集,制定模型训练数据标准,为AI模型的训练和优化提供高质量的数据支持; 5、参与平台大模型能力构建,跟踪调研前沿技术,推动公司AI技术创新,使相关AI技术在研发提效等业务落地并取得效益。
更新于 2025-08-18

校招算法类
我们正在寻找对AI Agent技术充满热情的应届毕业生加入我们的算法团队。你将参与设计和开发下一代智能Agent系统,致力于构建能够自主决策、多轮交互和复杂任务执行的AI应用。 主要工作内容: 1.参与Agent框架的设计与优化,包括规划、记忆、工具使用等核心模块 2.开发多模态Agent系统,支持文本、图像、语音等多种输入输出形式 3.研究和实现Agent的推理链优化,提升复杂任务的执行效率 4.构建Agent评测体系,设计自动化测试和性能监控方案 5.参与Agent在垂直领域的落地应用,如代码生成、数据分析、客服等场景 6.跟踪前沿研究,将最新理论成果快速转化为产品创新
更新于 2025-09-02

校招算法类
1、探索AIGC领域相关算法研究和应用落地 2、根据公司业务,根据特定场景进行算法分析和优化,面向场景包括但不限于文档智能、规划、创意文案/报告生成等 3、精通自然语言处理算法,对计算机视觉/语音语义/推荐等相关模型有了解,并对多模态算法持续follow和研究
更新于 2025-09-02