OCR はどんな画像を読み取れますか?

OCR は、印刷文字の鮮明でコントラストの高い画像で最も力を発揮します。スクリーンショット、スキャン文書、レシート、本のページ、スライド、看板やラベルの写真などです。ピントが合い、明るく、文字がまっすぐで、明るい背景に濃い文字が並ぶ画像が最も正確な結果になります。装飾的なフォント、低解像度、反射、手書きは難しく、よりきれいな画像が必要になることがあります。

どの言語に対応していますか?

複数の文字体系にまたがる 12 言語——英語、簡体字中国語、繁体字中国語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語、アラビア語、ロシア語、ヒンディー語です。認識を実行する前に、画像内の文字に合う言語を選んでください。そうすればエンジンが正しい文字セットを使います。

OCR の精度は高いですか?

精度はほぼ画像次第です。印刷文字の鮮明なスキャンは非常に確実に認識されますが、ぼやけたスマホ写真や薄れたレシートは難しくなります。ツールは結果ごとに信頼度スコアを表示し、よりシャープでコントラストの高い画像を使えば、いつでも精度を上げられます。

画像はどこかにアップロードされますか?

いいえ。認識はブラウザ内で動く WebAssembly の OCR エンジン、tesseract.js で実行されます。言語モデルは一度だけダウンロードされてキャッシュされ、画像はローカルで処理されます——サーバーには何も送信されないので、身分証、レシート、医療や金融の書類といったプライベートな文書も端末に留まります。

画像から文字へ — 無料オンライン OCR

画像の文字を打ち直すのはもうやめましょう

住所のスクリーンショット、レシートの写真、スキャンしたページ——そして本当に必要なのは、その中の文字だけ。OCR がなければ、画像を目を凝らして眺め、一語ずつ手で打ち直すしかありません。これは遅く、長い数字や見慣れないつづりでは間違えやすいものです。

光学文字認識がその作業を代わりにこなします。画像をドロップすれば、文字を編集できるテキストとして読み出し、どこへでもコピー・検索・貼り付けができます。打ち直しも、文字起こしサービスも、アカウントも不要です。

OCR が実際にやっていること

OCR——光学文字認識——は、文字の画像を本物のテキストに変えます。どちらにせよ画面には文字が見えていますが、コンピューターにとって画像は色のついたピクセルの集まりにすぎず、何かがその形を文字として認識するまで、その語は選択も検索もできません。OCR がそのステップです。画像内の文字領域を見つけ、その形をある言語の文字セットと照合し、編集できる文字列を出力します。

これは「写真の中の文字を選択する」機能、スキャン文書の検索、古い書籍のデジタル化を支えるのと同じ技術です。「OCR 文字認識」ツールは、あなたが渡したどんな画像にもこれを実行します——PNG、JPG、スクリーンショット、写真——そして、どれくらい確からしいかが分かるよう、文字を信頼度スコアとともに返します。

画像から文字を抽出する 3 ステップ

画像を開く。 スクリーンショット、写真、スキャンを「OCR 文字認識」ツールにドロップします。ローカルで読み込まれるので、認識が始まる前でさえ、画像がアップロードされることは決してありません。
言語を選んで認識する。 エンジンが正しい文字セットを読み込めるよう、画像内の文字の言語を選び、「文字を認識」をクリックします。ツールが画像をスキャンし、抽出した文字を、読み取りの鮮明さを反映した信頼度スコアとともに返します。
文字をコピーする。 認識された文字を、文書、メール、表計算、メモなどに貼り付けます。これで一連の流れは完了です——エクスポートの手順も、透かしも、サインインもありません。

ある言語を初めて実行するときは、そのモデルを一度だけダウンロードします。それ以降、認識は速く、オフラインでも動作します。

きれいで正確な結果を得るには

OCR の精度は、ツールよりも、与える画像でほとんど決まります。いくつかの習慣で大きな差がつきます。

手元で最も鮮明な画像を使う。 解像度が高いほど文字の形がはっきりします。画面を撮った写真より直接のスクリーンショット、手持ち撮影よりフラットベッドスキャンが優れています。
コントラストを最大に。 明るい背景に濃い文字が最も読みやすくなります。反射、影、文字の背後の雑然とした背景は避けましょう。
まっすぐにする。 文字部分にトリミングし、行が水平になるよう回転させます——傾いたり回転したりした文字は認識を狂わせます。
言語を合わせる。 言語を間違えると、エンジンは誤った文字セットで推測せざるを得ません。これは非ラテン文字で特に重要です。

印刷文字は手書きよりはるかに確実に認識されます。結果が乱れて返ってきたら、たいてい同じ画像のよりきれいでコントラストの高い版にすれば直ります。

このツールは複数の書記体系にまたがる 12 言語に対応しています——英語、簡体字中国語、繁体字中国語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語、アラビア語、ロシア語、ヒンディー語——つまり英語だけでなく、ラテン文字、CJK、アラビア文字、キリル文字、デーヴァナーガリー文字のテキストも扱えます。

なぜ OCR をブラウザで実行するのか

文字に変えたい画像は、最もプライベートなものであることがよくあります。スキャンした身分証、給与明細、診断書、カード番号が写ったレシート、プライベートなチャットのスクリーンショット。それらをクラウドの OCR サービスにアップロードするのは、原本を自分の管理外のサーバーに渡すことを意味します。

ブラウザ上のツールはそれを完全に回避します。認識はページ内で実行される WebAssembly の OCR エンジン、tesseract.js で動きます。言語モデルは一度だけダウンロードされてキャッシュされ、画像はあなた自身の端末で処理されます。認識中に何も送信されず、モデルがキャッシュされればオフラインでも動き続けます。同じプライバシーの考え方が、文書作業の残りの工程にも通じます——画像から文字を抜き出し、次に PDF から抜き出し、それを整える。ファイルが自分の端末から出なければ、漏れるものは何もありません。

クイックチェックリスト

画像をツールにドロップ——ローカルで読み込み、アップロードなし。
手元で最も鮮明でコントラストの高い版を使う。
認識前に、文字に合う言語を選ぶ。
「文字を認識」をクリックし、信頼度スコアを確認する。
結果をコピー——すべて自分の端末で起きたことを忘れずに。

画像を文字に変換する方法(無料 OCR、アップロード不要)

画像の文字を打ち直すのはもうやめましょう

OCR が実際にやっていること

画像から文字を抽出する 3 ステップ

きれいで正確な結果を得るには

なぜ OCR をブラウザで実行するのか

クイックチェックリスト

かんたんな手順

よくある質問

このガイドで使うツール