logo of xiaohongshu

小红书内容安全算法工程师-OCR 大模型方向

社招全职3-5年内容理解地点:上海状态:招聘

任职要求


1、计算机科学、数学、电子工程等相关专业本科及以上学历,具备3年以上ocr算法相关工作经验;
2、熟练掌握ocr算法原理,包括但不限于文字检测、文字识别、layout、kv提取、信息结构化、aigc样本生成、大模型ocr等;
3、具备跨部门沟通和协调能力,与产品、运营等部门进行沟通和协调的能力,保障定义清晰、落地到位;
4、熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、在内容安全中负责具体风险域的治理,通过策略及算法能力,解决内容安全问题
2、负责ocr算法的研究、开发、优化工作,包括但不限于文字检测、识别、layout、kv提取、信息结构化、多模态检索、aigc对抗样本生成、大模型ocr;
3、跟踪ocr领域的最新技术动态,对新技术进行评估并应用于产品研发中,解决各类泛化性、对抗性的问题;
4、与团队成员紧密合作,参与项目需求分析、系统设计、编码实现和测试验证;
5、根据项目需求,优化现有算法,提升ocr系统的性能、准确性和鲁棒性,快速迭代;
6、解决项目中的技术难题,确保项目的顺利进行。
包括英文材料
学历+
OCR+
算法+
大模型+
还有更多 •••
相关职位

logo of bytedance
校招A258081

团队介绍:国际电商是以TikTok为载体的电商业务(也称为TikTok Shop),致力于成为用户发现并获取优价好物的首选平台,在直播电商、视频内容电商、货架电商等多场景下,国际电商希望能为用户提供更个性化、更主动、更高效的消费体验,为商家提供稳定可靠的平台服务,致力于新奇好物畅销全球,美好生活触手可得的使命。 Data-电商团队是国际电商的核心算法技术力量,专注于电商领域的算法创新,帮助用户高效发现感兴趣的商品,保障用户的购物安全,提升交易各环节的智能化水平。在这里,你将与一流的产品和技术团队合作、钻研,一起应对技术和业务上的挑战,推动技术在电商场景的深度落地。 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。

更新于 2025-07-28杭州
logo of 01ai
社招3年以上算法

1. 负责大规模OCR识别结果的数据清洗、纠错与结构化处理,提升文本抽取的准确率与可用性; 2. 设计并构建面向垂直领域的知识图谱,包括实体识别、关系抽取、属性融合、图谱对齐等核心环节; 3. 基于业务场景对开源或自研大语言模型(LLM)进行领域适配与高效微调(如LoRA、QLoRA、Prompt Tuning等),提升模型在特定任务(如问答、推理、信息补全)上的表现; 4. 运用本体论(Ontology)方法设计领域知识体系,定义概念层级、语义关系与逻辑约束,支撑高质量知识建模与推理; 5. 探索多模态(图像+文本)信息融合策略,将OCR输出与视觉上下文结合,增强知识抽取与语义理解能力; 6. 与产品、数据及工程团队紧密协作,推动知识驱动型AI系统在内容理解、智能检索、风险识别等场景中的落地。

更新于 2026-01-27北京
logo of xiaohongshu
社招3年以上后端开发

岗位描述: 我们正在寻找一位具备扎实工程基础、对后端技术充满热情的工程师,参与小红书内容安全平台的智能化升级建设。该岗位以审核为核心业务背景,探索并落地内容审核架构&应用的落地,通过大模型与工程系统的深度融合,重构内容安全审核新模式,支撑百亿级内容审核规模,并探索国际化战场; 你将有机会参与前沿的审核架构落地以及业务升级,在快速演进的技术体系中,见证业务效率的跃迁、推动审核系统向更智能、更高效的方向发展。 岗位职责: 1. 负责内容安全能力(文本/图片/音视频/直播/文档等)在公司内外部业务的接入方案设计、落地与持续优化,保障接入效率与质量。 2. 建设统一接入框架与标准:SDK/API/网关策略/鉴权签名/回调通知/幂等重试/灰度发布等,降低业务接入成本。 3. 负责接入链路工程化与平台化:接入配置化、规则编排、策略路由、多引擎调度、结果聚合、降级与容灾等。 4. 建立接入全链路观测与运营能力:指标体系(QPS、延迟、命中率、拦截率、误杀漏放等)、日志追踪、告警与问题定位闭环。 5. 与算法、产品、风控、法务合规、运营及业务研发协作,推进标准化协议的执行落地、数据规范与审核策略在各业务快速复制和迁移。 6. 对接入质量与风险负责:高并发与低延迟保障、容量评估、压测、SLA、故障应急、数据安全与隐私合规。 7. 与团队成员进行系统设计与代码评审,推动工程规范、稳定性治理与技术沉淀。

更新于 2026-02-06北京|上海
logo of 01ai
社招3年以上研发

1、负责图像、视频、文本等多模态算法的研究与开发,聚焦内容理解与安全防护; 2、探索基于多模态的内容理解技术,并应用于图片、视频等数据的版权保护、溯源追踪、风险识别与内容认证; 3、设计并实现高鲁棒性数字水印系统,支持抗截图、抗转码、抗删除等常见攻击,满足版权标识与泄露溯源需求; 4、研发面向AIGC生成内容的可检测标识技术(Watermarking for Generative Models),实现AI生成内容的自动识别与归属判定; 5、探索优化多模态数据的分类分级算法与风控策略,构建“识别-标识-追踪-响应”一体化安全闭环; 6、跟踪CV与多媒体安全领域前沿技术(如Transformer、GAN、Diffusion模型、多模态大模型),结合业务场景进行技术落地。

更新于 2025-09-02北京