python pytesseract库的实例用法

说明

1、pytesseract需要与安装在本地的tesseract-ocr.exe文件一起使用。

2、需要注意的是,安装时必须选择中文包,默认只支持英文识别。

安装命令

pip install pytesseract

实例

import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open(r\"d:\\Desktop\\39DEE621-40EA-4ad1-90CC-79EB51D39347.png\"))
print(text)

识别结果输出

Using Tesseract OCR with Python
# import the necessary packages
from PIL import Image
import pytesseract
import ergperse
import cv2
import os
 
# construct the argument parse and parse the arguments
ap = argparse.ArgunentParser()
ap.add_argument(\"-i\", \"--image\", required-True,
help=\"path to input image to be OCR\'d\")
ap.add_argument(\"-p\", \"--preprocess\", typesstr, default=\"thresh\",
helpe\"type of preprocessing to be done\")
args = vars (ap.parse_args())

实例扩展:

Python使用pytesseract库识别图片文字

准备

首先需在本机安装Tesseract客户端,然后安装pytesseract库:

pip install pytesseract

没安装过PIL的也要安装一下,因为所调用的第一个参数是由Image类返回:

pip install PILLOW

实例

import pytesseract
from PIL import Image

img = Image.open(\"D://aa.jpg\")
text = pytesseract.image_to_string(img, lang=\"chi_sim\")
print(text)
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容