python怎么提取圖片文字

132次閱讀

共計 681 個字符，預計需要花費 2 分鐘才能閱讀完成。

要提取圖片中的文字，可以使用 Python 的 OCR（Optical Character Recognition，光學字符識別）庫。以下是使用 tesseract 庫進行圖片文字提取的示例代碼：

pip install tesseract
pip install pytesseract

import pytesseract
from PIL import Image

image = Image.open('image.jpg')  # 加載圖片
image = image.convert('L')  # 轉為灰度圖像

text = pytesseract.image_to_string(image)
print(text)

運行以上代碼后，將會輸出提取到的圖片文字。

需要注意的是，以上代碼使用的是 tesseract 的默認語言模型進行文字提取。如果需要提取特定語言的文字，可以使用 pytesseract.image_to_string 函數的 lang 參數指定語言模型，例如：

text = pytesseract.image_to_string(image, lang='chi_sim')  # 提取中文文字

此外，要使用 tesseract 進行文字提取，還需要將 tesseract 的可執行程序路徑添加到系統環境變量中，或者在代碼中指定 tesseract 的可執行程序路徑。

丸趣 TV 網 – 提供最優質的資源集合！

正文完

發表至： Python

2023-12-13

轉載說明：除特殊說明外本站除技術相關以外文章皆由網絡搜集發布，轉載請注明出處。

php讀取文件內容的方法有哪些

久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三