如何把圖片轉換成文字(免費 OCR,免上傳)

別再對著截圖、照片或掃描檔一個字一個字重新打了。本文教你用 OCR 把任何圖片裡的文字精準擷取出來——支援 12 種語言,而且全程在瀏覽器裡完成。

更新於 2026年6月25日

別再對著圖片重新打字了

你有一張地址截圖、一張收據照片,或一頁掃描檔——而你真正需要的,只是其中的文字。如果沒有 OCR,唯一的辦法就是瞇著眼盯著圖片,一個字一個字手動重打,既慢又容易在長串數字或不熟悉的拼寫上出錯。

光學字元辨識替你完成這項工作。把圖片拖進去,它就會把字元讀取成可編輯的文字,你可以隨處複製、搜尋和貼上。不用重打,不用找轉錄服務,也不用註冊帳號。

OCR 究竟做了什麼

OCR——光學字元辨識——把文字的圖片變成真正的文字。無論哪種方式你的螢幕都顯示著字母,但對電腦來說,圖片只是一堆彩色像素;在有東西把這些形狀辨識成字元之前,這些文字既不能選取也不能搜尋。OCR 就是這一步:它定位圖片中的文字區域,把形狀與某種語言的字元集做比對,然後輸出一段你可以編輯的文字。

這與「在照片裡選取文字」的功能、掃描文件搜尋以及古籍數位化背後是同一項技術。「OCR 文字辨識」工具會在你給它的任何圖片上運行它——PNG、JPG、截圖或照片——並把文字連同一個信心分數一起回傳給你,讓你知道它有多大把握。

三步從圖片中擷取文字

  1. 打開圖片。 把你的截圖、照片或掃描檔拖進「OCR 文字辨識」工具。它在本機完成讀取,所以圖片絕不會被上傳——即使在辨識開始之前也是如此。
  2. 選擇語言並辨識。 選擇圖片中文字所用的語言,好讓引擎載入正確的字元集,然後點擊「辨識文字」。工具會掃描圖片,回傳擷取出的文字,並附上一個反映讀取清晰程度的信心分數。
  3. 複製文字。 把辨識出的文字貼到你的文件、郵件、試算表或筆記裡。整個流程就這麼簡單——沒有匯出步驟,沒有浮水印,不用登入。

某種語言首次運行時會下載一次它的模型;之後辨識速度很快,甚至離線也能用。

如何獲得乾淨、準確的結果

OCR 的準確度主要取決於你餵給它的圖片,而不是工具本身。幾個習慣能帶來很大差別:

  • 用你手邊最清晰的圖片。 解析度越高,字元形狀越清晰。直接截圖勝過對著螢幕拍照;平台掃描勝過手持快拍。
  • 盡量提高對比度。 淺色背景上的深色文字辨識效果最好。避免反光、陰影和文字背後雜亂的背景。
  • 把它擺正。 裁剪到只剩文字,並旋轉使文字行保持水平——歪斜或旋轉的文字會讓辨識出錯。
  • 比對語言。 選錯語言會迫使引擎用錯誤的字元集去猜。這一點對非拉丁文字尤其重要。

印刷文字的辨識遠比手寫可靠得多。如果結果很亂,通常換用同一張圖片更乾淨、對比度更高的版本就能解決。

這個工具涵蓋橫跨多種書寫體系的十二種語言——英語、簡體中文、繁體中文、日語、韓語、西班牙語、法語、德語、葡萄牙語、阿拉伯語、俄語和印地語——所以它能處理拉丁文、CJK、阿拉伯文、西里爾文和天城文,而不只是英語。

為什麼要在瀏覽器裡跑 OCR

你最想轉成文字的圖片,往往也最私密:掃描的證件、薪資單、醫療信函、印著你卡號的收據、私人聊天的截圖。把這些上傳到雲端 OCR 服務,就意味著把原件交給了一台你無法掌控的伺服器。

基於瀏覽器的工具完全避開了這個問題。辨識由 tesseract.js 完成,這是一個在頁面內執行的 WebAssembly OCR 引擎;語言模型只需下載一次並會被快取,你的圖片在你自己的裝置上處理。辨識過程中不會傳輸任何東西,而且模型快取之後,離線也能繼續工作。同樣的隱私邏輯貫穿整個文件處理流程——先從圖片裡擷取文字,再從 PDF 裡擷取,然後做清理:只要檔案不離開你的機器,就沒有什麼可外洩的。

快速檢查清單

  • 把圖片拖進工具——本機讀取,免上傳。
  • 使用你手邊最清晰、對比度最高的版本。
  • 辨識前先選擇與文字相符的語言。
  • 點擊「辨識文字」並查看信心分數。
  • 複製結果——並記住:這一切都發生在你的裝置上。

快速步驟

  1. 1打開「OCR 文字辨識」工具,把圖片拖進去。不會有任何上傳——圖片在你的瀏覽器本機完成讀取。
  2. 2選擇圖片中文字所用的語言,然後點擊「辨識文字」。工具會掃描圖片,回傳辨識出的文字以及一個信心分數。
  3. 3複製擷取出的文字,貼到任何你需要的地方。圖片始終不會離開你的裝置,所以即使是私密文件的截圖也只留在你的機器上。

常見問題

OCR 在清晰、高對比度的印刷文字圖片上效果最好:截圖、掃描文件、收據、書頁、投影片,以及招牌或標籤的照片。 畫面銳利、光線充足、文字端正、深色文字配淺色背景的圖片辨識結果最準確。花體字、低解析度、反光和手寫都更難辨識, 可能需要更乾淨的圖片。

橫跨多種文字體系的十二種語言——英語、簡體中文、繁體中文、日語、韓語、西班牙語、法語、德語、葡萄牙語、阿拉伯語、 俄語和印地語。執行辨識前請選擇與圖片中文字相符的語言,這樣引擎才會使用正確的字元集。

準確度幾乎完全取決於圖片本身。清晰的印刷文字掃描檔辨識得非常可靠;模糊的手機照片或字跡淺淡的收據則更難。 工具會為每個結果顯示一個信心分數,而你隨時可以換用更銳利、對比度更高的圖片來提升準確度。

不會。辨識由 tesseract.js 完成,這是一個在瀏覽器內運行的 WebAssembly OCR 引擎。語言模型只需下載一次並會被快取, 你的圖片在本機處理——不會有任何內容傳送到伺服器,所以證件、收據、醫療或財務文件等私密資料都只留在你的裝置上。

本指南用到的工具