怎么用python提取圖片中的文字

164次閱讀

共計 625 個字符，預計需要花費 2 分鐘才能閱讀完成。

要在 Python 中提取圖像中的文字，您可以使用一個名為 Tesseract 的 OCR（光學字符識別）引擎。以下是使用 Tesseract 和 Python 提取圖像中的文字的示例代碼：

首先，您需要安裝 Tesseract OCR 引擎和 Python 的 Pytesseract 庫。您可以使用以下命令來安裝這些依賴項：

pip install pytesseract

接下來，您需要安裝 Tesseract OCR 引擎。您可以從以下鏈接下載并安裝 Tesseract OCR：https://github.com/tesseract-ocr/tesseract

安裝完這些依賴項后，可以使用以下 Python 代碼來提取圖像中的文字：

import pytesseract
from PIL import Image

# 打開圖像文件
img = Image.open('image.jpg')

# 使用 Tesseract 提取文字
text = pytesseract.image_to_string(img)

# 打印提取的文字
print(text)

以上代碼將打開名為 image.jpg 的圖像文件，然后使用 Tesseract OCR 引擎提取圖像中的文字，并將提取的文字打印到控制臺上。

請注意，Tesseract 的準確性可能會受到圖像質量、文字字體和大小等因素的影響。在使用 Tesseract 提取文字之前，建議您先對圖像進行預處理（如調整亮度、對比度、裁剪等），以提高提取準確性。

丸趣 TV 網 – 提供最優質的資源集合！

正文完

發表至： Python

2024-04-16

轉載說明：除特殊說明外本站除技術相關以外文章皆由網絡搜集發布，轉載請注明出處。

python如何獲取字符串的長度

久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

怎么用python提取圖片中的文字