要提取圖片中的文字,可以使用光學字符識別(OCR)技術,OCR 是一種將圖片中的文字轉換為可編輯、可搜索文本的技術,有許多 OCR 工具和庫可以用于 Python,如 pytesseract 和 Tesseract,以下是使用 pytesseract 提取圖片中文字的簡短解答:

1、安裝 pytesseract 和 Pillow 庫,在命令行中輸入以下命令:

pip install pytesseract
pip install Pillow

2、導入所需的庫,并設置 Tesseract 的路徑,在 Python 代碼中輸入以下內容:

from PIL import Image
import pytesseract
如果需要,設置 Tesseract 的路徑
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

3、打開圖片并使用 pytesseract 提取文字,在 Python 代碼中輸入以下內容:

image = Image.open('path/to/your/image.jpg')
text = pytesseract.image_to_string(image, lang='chi_sim')  # 如果是中文圖片,使用 'chi_sim' 語言包
print(text)

4、保存提取的文字到文件,在 Python 代碼中輸入以下內容:

with open('output.txt', 'w', encoding='utf-8') as f:
    f.write(text)

就是使用 pytesseract 提取圖片中文字的方法。

免責聲明:
本網站致力于提供合理、準確、完整的資訊信息,但不保證信息的合理性、準確性和完整性,且不對因信息的不合理、不準確或遺漏導致的任何損失或損害承擔責任。本網站所有信息僅供參考,不做交易和服務的根據, 如自行使用本網資料發生偏差,本站概不負責,亦不負任何法律責任。