- 作者:老汪软件技巧
- 发表时间:2024-10-16 15:02
- 浏览量:
快速阅读Surya 是一款功能强大的开源 OCR 工具包,支持超过 90 种语言的识别。Surya 能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya 完全免费且用于商业用途,支持跨平台运行,包括 Windows、Mac 和 Linux 系统,适合处理敏感信息的离线环境。正文(附运行示例)Surya 是什么
Surya 是一款功能强大的开源 OCR(光学字符识别)工具包,专门用于文档识别,支持超过 90 种语言的识别。它能准确识别文档中的文本,分析文本的阅读顺序,检测文档中的布局元素(如表格、图片和标题),并识别和解析表格内容。Surya 以其高效的表格识别能力而闻名,性能优于许多现有的开源模型,如 Table Transformer。Surya 完全免费,可用于商业用途,支持在 Windows、Mac 和 Linux 系统上运行,非常适合处理敏感信息的离线环境。
Surya 的主要功能如何运行 Surya
Surya 的安装和使用都非常简单。首先,你需要安装 Python 3.10+和 PyTorch。然后,你可以使用 pip 安装 Surya:
pip install surya-ocr
模型权重将首次运行 Surya 时自动下载。
OCR(文本识别)
此命令将写入一个包含检测到的文本和边界框的 json 文件:
surya_ocr DATA_PATH
文本行检测
此命令将写入一个包含检测到的边界框的 json 文件。
surya_detect DATA_PATH
布局分析
此命令将写入一个包含检测到的布局的 json 文件。
surya_layout DATA_PATH
阅读顺序
此命令将写入一个包含检测到的阅读顺序和布局的 json 文件。
surya_order DATA_PATH
表格识别
此命令将写入一个包含检测到的表格单元格和行/列 ID 的 json 文件,以及行/列边界框。
surya_table DATA_PATH
资源
❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!