
01 4月如何计算扫描中的单词
你有没有想过如何计算扫描中的单词?同样,你有没有想过如何从扫描的文档或图像中提取文本?使用常规pdf,计算单词通常不是问题。只需复制文本并将其粘贴到word文档中即可。嵌入在单词中的自动字数将为您提供单词数。
如果您正在用英文以外的其他语言阅读本文,该内容已由我们自动翻译WordPress多语言插件。



如果您正在用英文以外的其他语言阅读本文,该内容已由我们自动翻译WordPress多语言插件。
但是,一旦以pdf格式扫描单词,它们就会丢失文本特征并被视为图像。然而,这并不是绝望的理由,因为您可以使用光学字符识别(OCR)程序。 OCR所做的是读取扫描文档的每一行,以确定屏幕上的黑白像素代表什么(数字,单词,字符等)。如果您已经为Adobe Acrobat Professional和Abby FineReader等程序付费,则这些程序内置了OCR功能。
用开源软件计算扫描中的单词
但是,有完全合适的免费替代品可供下载。其中一个是free-ocr.com上的免费OCR。为了从扫描的文档中获取字数,您必须遵循以下步骤:
- 请点击以下链接 free-ocr.com
- 使用上传按钮上传您的内容
- 选择文本所在的语言
- 文本将在框中显示给您
- 复制文本并将其粘贴到MS Word文档中
- 自动字计数器将为您提供准确的指示
虽然快速而简单,但这种方法存在一个问题。它需要您将内容上传到网站上。如果您正在处理机密信息,这可能不是一个合适的选择。
更安全的替代方案是您下载免费版本的paperfile.net的OCR,可以下载这里。下载并安装程序后,您需要采取以下步骤来提取文本:
- 打开程序。您应该看到如下所示的示例提取。有一些关于如何提高提取质量的说明

- 选择要从/提取文本计算单词的pdf文件

- 单击OCR按钮并OCR当前页面

- 如果扫描正确,扫描的文本应显示在右侧框中

- 单击两个工作表之间的“单词”按钮,以便将文本提取到单词
- 在MS Word中打开文件并获取您的单词计数
但是免费程序只有两个缺点:
- 它不允许您选择英语以外的语言
- 您必须在不同页面之间切换以逐页获取字数。
使用高级产品扫描计算单词
还有其他程序,如AnyCount 7.0和Solid文档,专门用于计算单词,字符和行。虽然这些程序需要支付许可证,但它们具有上述免费版本的卓越功能。
两者都有免费试用版,您可以从各自的站点下载。
最后,还有一个移动解决方案来计算扫描文档中的单词。这是使用TextExtractor Scanner iPhone应用程序下载在Apple商店。您只需拍摄扫描文档的图片,应用程序将尝试自动将文本提取到Word文档或pdf中。将文本提取到word文档中可以轻松计算文档中的单词。此外,该应用程序允许从许多不同的语言中提取,包括基于字符的语言,如普通话和日语
所有OCR程序和方法的重要注意事项是扫描质量会影响提取的准确性。
WordPress插件