PDF OCR X, reconocimiento de caracteres para PDF

Puede que alguna vez hayáis tenido que extraer el texto de un PDF. Si el contenido del archivo es texto, es tan fácil como seleccionar el mismo y cortar y pegar, pero si el contenido del PDF es una captura gráfica, por ejemplo de un texto capturado mediante escáner o fotografía, tendremos que recurrir a un programa de reconocimiento de caracteres u OCR para que nos extraiga el contenido en modo texto. Y eso es precisamente lo que hace PDF OCR X , extraernos el contenido en un archivo .txt de texto plano.

El programa tiene muy poquitas opciones de configuración, la selección del idioma para que el reconocimiento sea lo más preciso posible, la disposición en una o varias columnas del texto y si los retornos de carro deben incluirse en el archivo de salida o no. En cuanto al idioma, podéis descargar más idiomas desde aquí. PDF OCR X tiene dos versiones, una gratuita pero que sólo nos permite reconocer PDF de una sola página, o la versión de pago, que cuesta 29.99 dólares y que no tiene dicha limitación. Permitidme recordar que si queréis extraer una página de un archivo PDF, podéis hacerlo desde Vista Previa, con tan sólo arrastrar y soltar dicha página fuera de la ventana, con lo que creará un archivo PDF nuevo con la misma.

Dependiendo de la resolución y calidad de las imágenes incluidas, el programa ofrece mejores o peores resultados. Si necesitamos más calidad de conversión a texto habrá que recurrir a programas de reconocimiento de caracteres más profesionales y que den salida formateada y no en .txt, pero para algún caso concreto la versión gratuita puede venirnos bien.

Vía | MacUpdate
Más información | PDF OCR X

RECIBE "Xatakaletter", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios