• 作者:老汪软件技巧
  • 发表时间:2024-10-16 15:02
  • 浏览量:

快速阅读Surya 是一款功能强大的开源 OCR 工具包,支持超过 90 种语言的识别。Surya 能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya 完全免费且用于商业用途,支持跨平台运行,包括 Windows、Mac 和 Linux 系统,适合处理敏感信息的离线环境。正文(附运行示例)Surya 是什么

Surya 是一款功能强大的开源 OCR(光学字符识别)工具包,专门用于文档识别,支持超过 90 种语言的识别。它能准确识别文档中的文本,分析文本的阅读顺序,检测文档中的布局元素(如表格、图片和标题),并识别和解析表格内容。Surya 以其高效的表格识别能力而闻名,性能优于许多现有的开源模型,如 Table Transformer。Surya 完全免费,可用于商业用途,支持在 Windows、Mac 和 Linux 系统上运行,非常适合处理敏感信息的离线环境。

Surya 的主要功能如何运行 Surya

Surya 的安装和使用都非常简单。首先,你需要安装 Python 3.10+和 PyTorch。然后,你可以使用 pip 安装 Surya:

pip install surya-ocr

模型权重将首次运行 Surya 时自动下载。

OCR(文本识别

此命令将写入一个包含检测到的文本和边界框的 json 文件:

surya_ocr DATA_PATH

文本行检测

此命令将写入一个包含检测到的边界框的 json 文件。

surya_detect DATA_PATH

布局分析

此命令将写入一个包含检测到的布局的 json 文件。

surya_layout DATA_PATH

阅读顺序

此命令将写入一个包含检测到的阅读顺序和布局的 json 文件。

surya_order DATA_PATH

表格识别

此命令将写入一个包含检测到的表格单元格和行/列 ID 的 json 文件,以及行/列边界框。

surya_table DATA_PATH

资源

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!