IT业界:3行代码,即可用Python从图片中提取文本!

    作者:课课家教育更新于: 2020-06-05 14:09:33

    在您开始之前,在你的计算机将需要Python,但您可能不需要下载它。首先检查(在命令行窗口输入python)有没有安装Python!如果你看到了一个Python解释器的响应,那么就能在它的显示窗口中得到一个版本号。通常较新的版本都可以做到Python的向前兼容。

    关注我,每天用Python做一件有趣的事,掌握一些实用的技巧。

    在这篇短文中,将向你展示如何使用Python的强大功能从图像中提取文本。这种技术的应用是无止境的。这个技术可以用到以下例子中:

    • 机器学习项目的数据挖掘
    • 拍摄收据并阅读处理内容

    第一步:设置Python库

    为了解决这个问题,我们将使用一个名为Python Tesseract的库。从图书馆网站:

    Python tesseract是Python的一个光学字符识别(OCR)工具。也就是说,它将识别并“读取”嵌入图像中的文本。

    Python tesseract是Google tesseract OCR引擎的包装器。它还可用作tesseract的独立调用脚本,因为它可以读取Pillow和Leptonica图像库支持的所有图像类型,包括jpeg、png、gif、bmp、tiff等。此外,如果用作脚本,Python tesseract将打印识别的文本,而不是将其写入文件。

    第二步:准备工作

    在设置要使用的Python库时,通常是一个单步过程。然而,对于PyTesseract,我们需要做两件事:

    • 安装Python库
    • 安装Tesseract应用程序

    首先,要安装Python库,只需打开命令行窗口并键入:

    pip install pytesseract

    然后,可通过Github项目地址:https://github.com/UB-Mannheim/tesseract/wiki,下载并安装Tesseract OCR可执行文件。

    在撰写本文时,我使用的是在2020-03-28年编译的64位Alpha Build v5.0.0。

    我们需要知道在哪里安装,因为我们需要让你的python脚本知道。

    如果你完成了上面的步骤,你就可以开始了。

    第三步:编写Python代码

    IT业界:3行代码,即可用Python从图片中提取文本!_IT业界_编程语言_python_课课家

     

    正如所开头说的那样,使用3行代码,您将能够从图片中读取文本:

    import pytesseract

     

    pytesseract.pytesseract.tesseract_cmd = r'C:\\Program Files\\Tesseract-OCR\\tesseract'

     

    print(pytesseract.image_to_string(r'D:\\examplepdf2image.png'))

    总结

    简单的三步就能从图片中提取文本,这是现在很多手机新品发布中,都会提及的特色卖点,通过拍照来识别文字。

    看完了文字就赶紧自己去练手吧~从今天开始,我将每天给大家分享一个Python技巧,欢迎大家持续关注我哦~

    Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发

课课家教育

未登录

1