Bild in Text umwandeln (kostenlose OCR, ohne Upload)

Schluss mit dem Abtippen von Text aus einem Screenshot, Foto oder Scan. So holen Sie die Wörter mit OCR aus jedem Bild heraus: präzise, in 12 Sprachen und komplett in Ihrem Browser.

Aktualisiert am 25. Juni 2026

Schluss mit dem Abtippen von Text aus einem Bild

Sie haben einen Screenshot einer Adresse, das Foto eines Belegs oder eine gescannte Seite — und das Einzige, was Sie wirklich brauchen, ist der Text darin. Ohne OCR bleibt nur, das Bild anzustarren und jedes Wort von Hand abzutippen, was langsam ist und bei langen Zahlen oder ungewohnten Schreibweisen leicht zu Fehlern führt.

Die optische Zeichenerkennung übernimmt diese Arbeit für Sie. Ziehen Sie ein Bild hinein, und sie gibt die Zeichen als bearbeitbaren Text aus, den Sie kopieren, durchsuchen und überall einfügen können. Kein Abtippen, kein Transkriptionsdienst und kein Konto.

Was OCR tatsächlich macht

OCR — optische Zeichenerkennung — verwandelt das Bild von Text in echten Text. Ihr Bildschirm zeigt so oder so Buchstaben, aber für einen Computer ist ein Bild nur eine Ansammlung farbiger Pixel; die Wörter lassen sich weder auswählen noch durchsuchen, solange nicht etwas die Formen als Zeichen erkennt. OCR ist genau dieser Schritt: Es findet die Textbereiche in einem Bild, gleicht die Formen mit dem Zeichensatz einer Sprache ab und gibt eine bearbeitbare Zeichenfolge aus.

Es ist dieselbe Technik, die hinter Funktionen wie „Text in einem Foto auswählen", der Suche in gescannten Dokumenten und der Digitalisierung alter Bücher steckt. Das Tool OCR-Texterkennung wendet sie auf jedes Bild an, das Sie ihm geben — ein PNG, JPG, einen Screenshot oder ein Foto — und liefert die Wörter samt einem Konfidenzwert zurück, damit Sie wissen, wie sicher es ist.

Drei Schritte, um Text aus einem Bild zu extrahieren

  1. Bild öffnen. Ziehen Sie Ihren Screenshot, Ihr Foto oder Ihren Scan in das Tool OCR-Texterkennung. Es wird lokal gelesen, sodass das Bild nie hochgeladen wird — auch nicht vor dem Start der Erkennung.
  2. Sprache wählen und erkennen. Wählen Sie die Sprache des Textes im Bild, damit die Engine den richtigen Zeichensatz lädt, und klicken Sie dann auf Text erkennen. Das Tool scannt das Bild und gibt die extrahierten Wörter samt einem Konfidenzwert zurück, der widerspiegelt, wie sauber die Erkennung war.
  3. Text kopieren. Nehmen Sie den erkannten Text und fügen Sie ihn in Ihr Dokument, Ihre E-Mail, Tabelle oder Notizen ein. Das ist der ganze Ablauf — kein Exportschritt, kein Wasserzeichen, keine Anmeldung.

Beim ersten Durchlauf für eine Sprache wird deren Modell einmal heruntergeladen; danach ist die Erkennung schnell und funktioniert sogar offline.

So erzielen Sie saubere, genaue Ergebnisse

Die OCR-Genauigkeit hängt vor allem vom Bild ab, das Sie ihr zuführen, nicht vom Tool. Ein paar Gewohnheiten machen einen großen Unterschied:

  • Verwenden Sie das schärfste Bild, das Sie haben. Höhere Auflösung bedeutet klarere Zeichenformen. Ein direkter Screenshot ist besser als das Foto eines Bildschirms; ein Flachbettscan ist besser als ein freihändiger Schnappschuss.
  • Maximieren Sie den Kontrast. Dunkler Text auf hellem Hintergrund liest sich am besten. Vermeiden Sie Spiegelungen, Schatten und unruhige Hintergründe hinter dem Text.
  • Richten Sie es gerade aus. Schneiden Sie auf den Text zu und drehen Sie ihn, damit die Zeilen waagerecht verlaufen — schräger oder gedrehter Text bringt die Erkennung durcheinander.
  • Sprache abstimmen. Die falsche Sprache zu wählen zwingt die Engine, mit dem falschen Zeichensatz zu raten. Das fällt besonders bei nicht lateinischen Schriften ins Gewicht.

Gedruckter Text wird weit zuverlässiger erkannt als Handschrift. Kommt ein Ergebnis unsauber zurück, behebt eine sauberere, kontrastreichere Version desselben Bildes das in der Regel.

Das Tool deckt zwölf Sprachen über mehrere Schriftsysteme ab — Englisch, vereinfachtes und traditionelles Chinesisch, Japanisch, Koreanisch, Spanisch, Französisch, Deutsch, Portugiesisch, Arabisch, Russisch und Hindi —, es verarbeitet also lateinischen, CJK-, arabischen, kyrillischen und Devanagari-Text, nicht nur Englisch.

Warum OCR im Browser ausführen

Die Bilder, die Sie am dringendsten in Text umwandeln möchten, sind oft die privatesten: ein gescannter Ausweis, eine Gehaltsabrechnung, ein Arztbrief, ein Beleg mit Ihrer Kartennummer, der Screenshot eines privaten Chats. Diese in einen Cloud-OCR-Dienst hochzuladen heißt, das Original einem Server zu überlassen, den Sie nicht kontrollieren.

Ein browserbasiertes Tool vermeidet das vollständig. Die Erkennung läuft mit tesseract.js, einer WebAssembly-OCR-Engine, die innerhalb der Seite ausgeführt wird; das Sprachmodell wird einmal heruntergeladen und zwischengespeichert, und Ihr Bild wird auf Ihrem eigenen Gerät verarbeitet. Während der Erkennung wird nichts übertragen, und sobald das Modell im Cache liegt, funktioniert es weiterhin offline. Dieselbe Datenschutzlogik zieht sich durch den restlichen Dokumenten-Workflow — Text aus einem Bild holen, dann aus einem PDF, dann bereinigen: Verlässt die Datei nie Ihren Rechner, gibt es nichts, was nach außen dringen könnte.

Kurze Checkliste

  • Bild in das Tool ziehen — es wird lokal gelesen, kein Upload.
  • Die schärfste, kontrastreichste Version verwenden, die Sie haben.
  • Vor der Erkennung die Sprache wählen, die zum Text passt.
  • Auf Text erkennen klicken und den Konfidenzwert prüfen.
  • Das Ergebnis kopieren — und daran denken, dass alles auf Ihrem Gerät passiert ist.

Schnelle Schritte

  1. 1Öffnen Sie das Tool OCR-Texterkennung und ziehen Sie Ihr Bild hinein. Es wird nichts hochgeladen — das Bild wird lokal in Ihrem Browser gelesen.
  2. 2Wählen Sie die Sprache des Textes im Bild und klicken Sie auf Text erkennen. Das Tool scannt das Bild und gibt die Wörter samt einem Konfidenzwert zurück.
  3. 3Kopieren Sie den extrahierten Text und fügen Sie ihn dort ein, wo Sie ihn brauchen. Das Bild verlässt nie Ihr Gerät, sodass selbst der Screenshot eines privaten Dokuments auf Ihrem Rechner bleibt.

Häufig gestellte Fragen

OCR funktioniert am besten bei klaren, kontrastreichen Bildern von gedrucktem Text: Screenshots, gescannten Dokumenten, Belegen, Buchseiten, Folien und Fotos von Schildern oder Etiketten. Scharfe, gut ausgeleuchtete Bilder mit geradem, dunklem Text auf hellem Hintergrund liefern die genauesten Ergebnisse. Verschnörkelte Schriften, niedrige Auflösung, Spiegelungen und Handschrift sind schwieriger und benötigen womöglich ein saubereres Bild.

Zwölf Sprachen über mehrere Schriftsysteme — Englisch, vereinfachtes und traditionelles Chinesisch, Japanisch, Koreanisch, Spanisch, Französisch, Deutsch, Portugiesisch, Arabisch, Russisch und Hindi. Wählen Sie vor der Erkennung die Sprache, die zum Text in Ihrem Bild passt, damit die Engine den richtigen Zeichensatz verwendet.

Die Genauigkeit hängt fast vollständig vom Bild ab. Ein gestochen scharfer Scan von gedrucktem Text wird sehr zuverlässig erkannt; ein verwackeltes Handyfoto oder ein verblasster Beleg sind schwieriger. Das Tool zeigt zu jedem Ergebnis einen Konfidenzwert an, und Sie können die Genauigkeit jederzeit verbessern, indem Sie ein schärferes, kontrastreicheres Bild verwenden.

Nein. Die Erkennung läuft mit tesseract.js, einer WebAssembly-OCR-Engine, die direkt in Ihrem Browser arbeitet. Das Sprachmodell wird einmal heruntergeladen und zwischengespeichert, und Ihr Bild wird lokal verarbeitet — es wird nichts an einen Server gesendet, sodass private Dokumente wie Ausweise, Belege und medizinische oder finanzielle Unterlagen auf Ihrem Gerät bleiben.

In dieser Anleitung verwendete Tools