CatOCR: página gratuita para extraer el texto de imágenes y archivos PDF

CatOCR: página gratuita para extraer el texto de imágenes y archivos PDF

CatOCR es una página que nos va a resultar muy útil para extraer el texto contenido en imágenes y documentos o archivos PDF. Se trata de una herramienta web de uso gratuito y en la que no es necesario crear una cuenta o registrarse.

Este tipo de herramientas usan la tecnología OCR, de las siglas en inglés de “reconocimiento óptico de caracteres”, para extraer el texto contenido en imágenes y fotografías.

La principal característica de CatOCR es que resulta muy fácil de utilizar, a pesar de un pequeño problema que comentaré más adelante, y que por lo general ofrece muy buenos resultados al extraer los textos.


Los usos posibles de esta herramienta son muchos. Por poner un solo ejemplo, sirve para extraer cualquier texto contenido en una imagen de forma automática, sin tener que realizar de forma “manual” una copia del texto por nuestra parte.

¿Cómo extraer el texto de imágenes y PDF con CatOCR?

Ya os he comentado que el uso de CatOCR es bastante sencillo. Aún así, hice alusión a un “pequeño problema” que no va a impedir que podamos utilizar esta herramienta para extraer el texto de las imágenes.

Este problema no es otro que el idioma de la página, se encuentra en chino o a mitad de traducir al inglés. Pero, como ya adelantaba, esto no va a suponer un problema. Puedes usar el traductor de idiomas incorporado en Chrome, si utilizas este navegador, o simplemente seguir estos pasos:

  • Pulsa sobre el botón de color azul y selecciona la imagen (JPG, PNG, WEBP, BMP o TIF) o documento PDF al que vas a extraer el texto.
  • Ahora, la extracción del texto se realizará de forma automática. No importa el idioma del texto, lo detecta automáticamente, y solo debes retocarlo si existen algunas diferencias con el original.
  • Ve a la parte superior de la página, allí encontrarás los iconos que debes pulsar para “copiar el texto“, descargarlo como un documento de Word o exportarlo como un documento PDF.

Visita esta página para extraer textos de imágenes y PDF

Únicamente debes hacer una visita al sitio web de CatOCR para usar esta herramienta, con la que puedes extraer textos de imágenes y documentos PDF de manera gratuita.

Una herramienta web similar, en este caso sirve para convertir archivos PDF en documentos de Word, es PDF OCR.