购买来自的话

关于

数字-IN-A-扫描第一步

如何计算扫描中的单词

你有没有想过如何计算扫描中的单词?同样,你有没有想过如何从扫描的文档或图像中提取文本?使用常规pdf,计算单词通常不是问题。只需复制文本并将其粘贴到word文档中即可。嵌入在单词中的自动字数将为您提供单词数。
如果您正在用英文以外的其他语言阅读本文,该内容已由我们自动翻译WordPress多语言插件。

但是,一旦以pdf格式扫描单词,它们就会丢失文本特征并被视为图像。然而,这并不是绝望的理由,因为您可以使用光学字符识别(OCR)程序。 OCR所做的是读取扫描文档的每一行,以确定屏幕上的黑白像素代表什么(数字,单词,字符等)。如果您已经为Adobe Acrobat Professional和Abby FineReader等程序付费,则这些程序内置了OCR功能。

用开源软件计算扫描中的单词

但是,有完全合适的免费替代品可供下载。其中一个是free-ocr.com上的免费OCR。为了从扫描的文档中获取字数,您必须遵循以下步骤:

  • 请点击以下链接 free-ocr.com
  • 使用上传按钮上传您的内容
  • 选择文本所在的语言
  • 文本将在框中显示给您
  • 复制文本并将其粘贴到MS Word文档中
  • 自动字计数器将为您提供准确的指示

虽然快速而简单,但这种方法存在一个问题。它需要您将内容上传到网站上。如果您正在处理机密信息,这可能不是一个合适的选择。

更安全的替代方案是您下载免费版本的paperfile.net的OCR,可以下载这里。下载并安装程序后,您需要采取以下步骤来提取文本:

    • 打开程序。您应该看到如下所示的示例提取。有一些关于如何提高提取质量的说明
数字-IN-A-扫描第二步
    • 选择要从/提取文本计算单词的pdf文件
数字-IN-A-扫描步骤3
    • 单击OCR按钮并OCR当前页面
数字-IN-A-扫描步骤4
    • 如果扫描正确,扫描的文本应显示在右侧框中
WP Multilingual Plugin
  • 单击两个工作表之间的“单词”按钮,以便将文本提取到单词
  • 在MS Word中打开文件并获取您的单词计数

但是免费程序只有两个缺点:

  • 它不允许您选择英语以外的语言
  • 您必须在不同页面之间切换以逐页获取字数。

使用高级产品扫描计算单词

还有其他程序,如AnyCount 7.0和Solid文档,专门用于计算单词,字符和行。虽然这些程序需要支付许可证,但它们具有上述免费版本的卓越功能。

两者都有免费试用版,您可以从各自的站点下载。

最后,还有一个移动解决方案来计算扫描文档中的单词。这是使用TextExtractor Scanner iPhone应用程序下载在Apple商店。您只需拍摄扫描文档的图片,应用程序将尝试自动将文本提取到Word文档或pdf中。将文本提取到word文档中可以轻松计算文档中的单词。此外,该应用程序允许从许多不同的语言中提取,包括基于字符的语言,如普通话和日语

所有OCR程序和方法的重要注意事项是扫描质量会影响提取的准确性。

Pascal Evertz
本土化