共計 625 個字符,預計需要花費 2 分鐘才能閱讀完成。
要在 Python 中提取圖像中的文字,您可以使用一個名為 Tesseract 的 OCR(光學字符識別)引擎。以下是使用 Tesseract 和 Python 提取圖像中的文字的示例代碼:
首先,您需要安裝 Tesseract OCR 引擎和 Python 的 Pytesseract 庫。您可以使用以下命令來安裝這些依賴項:
pip install pytesseract
接下來,您需要安裝 Tesseract OCR 引擎。您可以從以下鏈接下載并安裝 Tesseract OCR:https://github.com/tesseract-ocr/tesseract
安裝完這些依賴項后,可以使用以下 Python 代碼來提取圖像中的文字:
import pytesseract
from PIL import Image
# 打開圖像文件
img = Image.open('image.jpg')
# 使用 Tesseract 提取文字
text = pytesseract.image_to_string(img)
# 打印提取的文字
print(text)
以上代碼將打開名為 image.jpg
的圖像文件,然后使用 Tesseract OCR 引擎提取圖像中的文字,并將提取的文字打印到控制臺上。
請注意,Tesseract 的準確性可能會受到圖像質量、文字字體和大小等因素的影響。在使用 Tesseract 提取文字之前,建議您先對圖像進行預處理(如調整亮度、對比度、裁剪等),以提高提取準確性。
丸趣 TV 網 – 提供最優質的資源集合!
正文完