logo of sensetime

商汤研究院-大模型文档处理实习生

实习兼职技术族-实习地点:北京 | 深圳状态:招聘

任职要求


1. 计算机、软件等相关专业本科在读及以上学历。
2. 熟悉多模态模型架构,了解多种微调技术及训练方法。
4. 了解Linux操作系统,能熟练使用常用命令。
5. 热爱计算机工作,有团队合作精神。
6. 加分项:有大模型领域相关论文。

工作职责


1. 参与文档场景相关的视觉算法技术研发和自然语言算法技术研发,包括但不限于文档识别,关键信息提取等。
2. 深入了解训练数据内容,跟踪业界前沿理论和方法,持续提升输出数据的质量。
包括英文材料
学历+
Linux+
大模型+
相关职位

logo of sensetime
社招技术族-实习

1. 参与文档场景相关的视觉算法技术研发和自然语言算法技术研发,包括但不限于文档识别,关键信息提取等。 2. 深入了解训练数据内容,跟踪业界前沿理论和方法,持续提升输出数据的质量。

更新于 2025-05-09
logo of sensetime
校招算法研究

1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 与工程团队协作,将算法集成到产品中,支撑金融业务场景的迭代优化; 3. 负责某一细分领域的深入算法研究,包括但不限于基础模型开发、对齐研究、推理优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在金融场景中的任务规划、工具调用及自主决策能力; 5. 维护相关研究和业务方向的基准(代码、数据、Prompt/Instruction等),将创新算法沉淀为论文、技术报告或专利。

更新于 2025-08-21
logo of sensetime
校招算法研究

1. 参与文档解析多模态大模型的研发,包括预训练、微调、指令对齐和推理优化; 2. 设计并实现高效的训练与推理系统,解决大规模文档数据处理、算力利用与模型优化问题; 3. 针对复杂文档场景,探索文本、版面(layout)、表格、公式、印章等多模态元素的解析方法; 4. 构建并优化文档解析全流程,包括数据预处理、模型训练、评测指标与工程化部署; 5. 结合业务需求,提出创新性方案并推动落地,形成可复现、可扩展的工程化体系。

更新于 2025-09-08
logo of sensetime
校招算法研究

1. 参与文档解析多模态大模型的研发和迭代,研发高效的强化学习训练与推理系统,解决大规模图文数据处理、算力利用及模型优化问题; 2. 设计并实现适用于多模态大模型的奖励机制,涵盖图文对齐、复杂推理、OCR/文档解析、表格理解、视觉问答、Agent 操作等多模态任务,探索创新性强化学习算法与多模态对齐方法; 3. 构建并优化多模态强化学习流程,包括数据生成、奖励模型训练、策略优化(如 PPO / DPO / GRPO 等)、模型评测与部署,实现模型能力的精准量化与持续优化; 4. 结合业务需求提出创新方案,推动 RL 优化后的多模态大模型在办公自动化、教育、金融等领域落地应用。

更新于 2025-09-08