python如何捕捉屏幕上的文字

159次閱讀

共計 862 個字符，預計需要花費 3 分鐘才能閱讀完成。

要捕捉屏幕上的文字，你可以使用 Python 中的 pytesseract 庫。pytesseract 是一個 OCR（光學字符識別）庫，可以用于提取圖像中的文字。
首先，確保你已經安裝了 pytesseract 庫。你可以使用以下命令在命令提示符或終端中安裝它：

pip install pytesseract

然后，你需要安裝并配置 tesseract OCR 引擎。你可以在 https://github.com/tesseract-ocr/tesseract 下載并安裝它。
以下是一個示例代碼，演示如何使用 pytesseract 捕捉屏幕上的文字：

import pyautogui
import pytesseract
# 設置 tesseract OCR 引擎的路徑，如果你的安裝路徑不同，請相應修改
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'
# 使用 pyautogui 模塊截取屏幕上的一部分圖像
image = pyautogui.screenshot(region=(100, 100, 300, 300))
# 將截取的圖像保存為臨時文件
image_path = 'temp.png'
image.save(image_path)
# 使用 pytesseract 識別圖像中的文字
text = pytesseract.image_to_string(image_path)
# 輸出識別到的文字
print(text)
# 刪除臨時文件
os.remove(image_path)

此代碼將在屏幕上的 (100, 100) 位置開始，截取 300×300 像素大小的圖像。然后，它將圖像保存為臨時文件，并使用 pytesseract 進行 OCR 處理，提取其中的文字。最后，它會輸出識別到的文字。
請注意，這個示例代碼假設你已經安裝了 pytesseract 和 tesseract OCR，并且指定了正確的 tesseract_cmd 路徑。如果你的安裝路徑不同，請相應修改該路徑。

丸趣 TV 網 – 提供最優質的資源集合！

正文完