要從圖片上提取文字,可以使用光學字符識別(OCR)技術,OCR是一種將圖像中的文字轉換為可編輯文本的技術,有許多現成的OCR工具和庫可以幫助我們實現這個目標,例如Tesseract OCR、Google Cloud Vision API等。
以下是使用Python和Tesseract OCR從圖片上提取文字的簡短步驟:
1、安裝Tesseract OCR,在Windows、macOS或Linux上,可以從這里下載并安裝:https://github.com/UB-Mannheim/tesseract/wiki
2、安裝Python的pytesseract庫,在命令行中運行以下命令:
pip install pytesseract
3、安裝Python的Pillow庫,在命令行中運行以下命令:
pip install Pillow
4、編寫Python代碼,使用pytesseract庫從圖片中提取文字,示例代碼如下:
from PIL import Image import pytesseract 指定Tesseract OCR的安裝路徑(僅在Windows上需要) pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 打開圖片文件 image = Image.open('example.jpg') 使用Tesseract OCR提取圖片中的文字 text = pytesseract.image_to_string(image, lang='chi_sim') # 如果圖片中的文字是中文,請使用lang='chi_sim',否則使用lang='eng' 輸出提取到的文字 print(text)
5、運行代碼,觀察輸出結果,如果一切正常,圖片中的文字應該已經被成功提取。
發表評論