Cómo convertir una imagen en texto (OCR gratis, sin subir archivos)

Deja de reescribir el texto atrapado en una captura, una foto o un escaneo. Así extraes las palabras de cualquier imagen con OCR: con precisión, en 12 idiomas y por completo dentro de tu navegador.

Actualizado el 25 de junio de 2026

Deja de reescribir el texto de una imagen

Tienes una captura de una dirección, la foto de un ticket o una página escaneada, y lo único que de verdad necesitas es el texto que contiene. Sin OCR, la única opción es entornar los ojos ante la imagen y reescribir cada palabra a mano, algo lento y fácil de equivocar con números largos o grafías poco conocidas.

El reconocimiento óptico de caracteres hace ese trabajo por ti. Arrastras una imagen y lee los caracteres como texto editable que puedes copiar, buscar y pegar donde quieras. Sin reescribir, sin servicio de transcripción y sin cuenta.

Qué hace realmente el OCR

El OCR —reconocimiento óptico de caracteres— convierte la imagen del texto en texto real. Tu pantalla muestra letras en ambos casos, pero para un ordenador una imagen son solo píxeles de colores; las palabras no se pueden seleccionar ni buscar hasta que algo reconoce las formas como caracteres. El OCR es ese paso: localiza las zonas de texto en una imagen, compara las formas con el conjunto de caracteres de un idioma y devuelve una cadena que puedes editar.

Es la misma tecnología que hay detrás de las funciones de "seleccionar texto en una foto", la búsqueda en documentos escaneados y la digitalización de libros antiguos. La herramienta de Reconocimiento de Texto OCR la aplica a cualquier imagen que le des —un PNG, JPG, captura o foto— y te devuelve las palabras junto con una puntuación de confianza para que sepas hasta qué punto es fiable.

Tres pasos para extraer texto de una imagen

  1. Abre la imagen. Arrastra tu captura, foto o escaneo a la herramienta de Reconocimiento de Texto OCR. Se lee localmente, así que la imagen nunca se sube, ni siquiera antes de empezar el reconocimiento.
  2. Elige el idioma y reconoce. Selecciona el idioma del texto de la imagen para que el motor cargue el conjunto de caracteres correcto y pulsa Reconocer Texto. La herramienta analiza la imagen y devuelve las palabras extraídas junto con una puntuación de confianza que refleja lo limpia que fue la lectura.
  3. Copia el texto. Toma el texto reconocido y pégalo en tu documento, correo, hoja de cálculo o notas. Ese es todo el ciclo: sin paso de exportación, sin marca de agua y sin iniciar sesión.

La primera ejecución de un idioma descarga su modelo una sola vez; después, el reconocimiento es rápido y funciona incluso sin conexión.

Cómo obtener resultados limpios y precisos

La precisión del OCR depende sobre todo de la imagen que le des, no de la herramienta. Unos pocos hábitos marcan una gran diferencia:

  • Usa la imagen más nítida que tengas. Más resolución significa formas de caracteres más claras. Una captura directa supera a la foto de una pantalla; un escaneo plano supera a una instantánea a pulso.
  • Maximiza el contraste. El texto oscuro sobre fondo claro se lee mejor. Evita reflejos, sombras y fondos recargados detrás del texto.
  • Enderézala. Recorta hasta el texto y gira para que las líneas queden horizontales: el texto inclinado o rotado entorpece el reconocimiento.
  • Acierta con el idioma. Seleccionar el idioma equivocado obliga al motor a adivinar con el conjunto de caracteres incorrecto. Esto importa sobre todo en los sistemas de escritura no latinos.

El texto impreso se reconoce con mucha más fiabilidad que la escritura a mano. Si un resultado vuelve desordenado, una versión más limpia y con más contraste de la misma imagen suele arreglarlo.

La herramienta cubre doce idiomas en varios sistemas de escritura —inglés, chino simplificado y tradicional, japonés, coreano, español, francés, alemán, portugués, árabe, ruso e hindi—, así que maneja texto latino, CJK, árabe, cirílico y devanagari, no solo inglés.

Por qué ejecutar el OCR en tu navegador

Las imágenes que más quieres convertir en texto suelen ser las más privadas: un DNI escaneado, una nómina, una carta médica, un ticket con el número de tu tarjeta, la captura de un chat privado. Subirlas a un servicio de OCR en la nube significa entregar el original a un servidor que no controlas.

Una herramienta basada en el navegador evita eso por completo. El reconocimiento se ejecuta con tesseract.js, un motor de OCR en WebAssembly que se ejecuta dentro de la página; el modelo de idioma se descarga una vez y se guarda en caché, y tu imagen se procesa en tu propio dispositivo. No se transmite nada durante el reconocimiento y, una vez guardado el modelo en caché, sigue funcionando sin conexión. La misma lógica de privacidad recorre el resto de un flujo de trabajo con documentos —sacar texto de una imagen, luego de un PDF y después limpiarlo—: si el archivo nunca sale de tu equipo, no hay nada que filtrar.

Lista rápida de comprobación

  • Arrastra la imagen a la herramienta: se lee localmente, sin subir nada.
  • Usa la versión más nítida y con más contraste que tengas.
  • Selecciona el idioma que coincida con el texto antes de reconocer.
  • Pulsa Reconocer Texto y revisa la puntuación de confianza.
  • Copia el resultado, y recuerda que todo ocurrió en tu dispositivo.

Pasos rápidos

  1. 1Abre la herramienta de Reconocimiento de Texto OCR y arrastra tu imagen. No se sube nada: la imagen se lee localmente en tu navegador.
  2. 2Elige el idioma del texto de la imagen y pulsa Reconocer Texto. La herramienta analiza la imagen y devuelve las palabras junto con una puntuación de confianza.
  3. 3Copia el texto extraído y pégalo donde lo necesites. La imagen nunca sale de tu dispositivo, así que incluso la captura de un documento privado se queda en tu equipo.

Preguntas frecuentes

El OCR funciona mejor con imágenes nítidas y de alto contraste de texto impreso: capturas, documentos escaneados, tickets, páginas de libros, diapositivas y fotos de carteles o etiquetas. Las imágenes nítidas y bien iluminadas, con texto oscuro y recto sobre fondo claro, dan los resultados más precisos. Las tipografías muy estilizadas, la baja resolución, los reflejos y la escritura a mano son más difíciles y pueden necesitar una imagen más limpia.

Doce idiomas en varios sistemas de escritura: inglés, chino simplificado y tradicional, japonés, coreano, español, francés, alemán, portugués, árabe, ruso e hindi. Elige el idioma que coincida con el texto de tu imagen antes de ejecutar el reconocimiento para que el motor use el conjunto de caracteres adecuado.

La precisión depende casi por completo de la imagen. Un escaneo nítido de texto impreso se reconoce de forma muy fiable; una foto movida desde el móvil o un ticket descolorido cuestan más. La herramienta muestra una puntuación de confianza con cada resultado, y siempre puedes mejorar la precisión usando una imagen más nítida y con más contraste.

No. El reconocimiento se ejecuta con tesseract.js, un motor de OCR en WebAssembly que funciona dentro de tu navegador. El modelo de idioma se descarga una sola vez y se guarda en caché, y tu imagen se procesa localmente: no se envía nada a un servidor, así que los documentos privados como DNI, tickets o papeles médicos y financieros se quedan en tu dispositivo.

Herramientas usadas en esta guía