OCR 文字認識

光学文字認識を使用して画像からテキストを抽出します。

ブラウザ内処理のみ(オフライン対応)
1

テキストを入力

内容を貼り付けるか入力してください。

2

設定を調整

お好みの結果になるようオプションを設定。

3

コピーまたは保存

出力をクリップボードにコピーまたは保存。

このツールについて

OCR 文字認識とは?

OCR 文字認識は、Tesseract.js を使った光学文字認識により画像から読み取れるテキストを抽出します。文書、スクリーンショット、レシート、手書きメモの写真をアップロードするだけで、コピー・編集・利用できるテキストコンテンツが得られます。

英語、中国語、日本語、韓国語、スペイン語、フランス語、ドイツ語など12以上の言語に対応 — すべてブラウザ内でローカル処理されます。

主な活用例

  • 文書デジタル化:印刷文書、レシート、手紙を編集可能なテキストに変換
  • スクリーンショットのテキスト抽出:ウェブページ、エラーメッセージ、チャットログのスクリーンショットからテキストを取得
  • 翻訳準備:翻訳のために画像から外国語テキストを抽出
  • データ入力:フォーム、請求書、名刺のテキストを素早くデジタル化
  • アクセシビリティ:画像ベースのテキストをスクリーンリーダーでアクセス可能に

プライバシー優先の OCR 処理

OCR は Tesseract.js(WebAssembly)を使って完全にブラウザ内で実行されます。言語モデルは一度ダウンロードされてローカルにキャッシュされます。

  • 画像と文書はデバイスの外に出ません — 機密文書の処理に重要
  • クラウド API の呼び出しなし — 認識中のデータ送信ゼロ
  • 言語モデルのキャッシュ後はオフラインでも動作
  • 医療記録、財務諸表、法的文書などの機密文書に最適

よくある質問

英語、中国語(簡体字/繁体字)、日本語、韓国語、スペイン語、フランス語、ドイツ語など、12以上の言語に対応しています。
精度は画像の品質とテキストの鮮明さに依存します。コントラストが良く高解像度の画像が最良の結果を生みます。
いいえ。すべての処理はブラウザ内で完結します。データがデバイスから出ることは一切ありません。サーバーへのアップロードは行われません。
はい。ページを一度読み込めば、完全にオフラインで動作します。より快適にご利用いただくには、ブラウザから PrivaDeck を PWA としてインストールしてください。
サーバー側の制限はありません。最大ファイルサイズはデバイスの利用可能なメモリとブラウザの性能によって異なります。最近のデバイスであれば数百 MB までのファイルを問題なく処理できます。