Convertir un pdf a formato html
Para conseguir trabajar con el texto de un pdf protegido éste se puede transformar en un html. Adobe lo pone fácil.
Mucha de la información a la que accedemos a través de Internet se encuentra en formato pdf. Si el documento en Portable Document Format se encuentra bloqueado no podemos hacer ciertas cosas que nos pueden interesar, como extraer el texto del mismo, a no ser que se tenga la contraseña correspondiente.
El socorrido CTRL C + CTRL V está por tanto limitado con este bloqueo, pero existe una forma de poder copiar el texto. La solución más sencilla es pasarlo a un fichero html. Con la versión completa del programa Adobe Acrobat esto sería posible, pero no lo es con el lector gratuito con el lector que nos viene instalado en el ordenador.
Adobe, sin embargo, si pone a disposición del usuario una solución on line para hacer la conversión. A través de la página http://access.adobe.com/simple_form.html es posible.
Tan sólo hay que introducir la dirección web donde se encuentra el pdf y elegir el tipo de documento que se quiere obtener (html 3.2 o texto). Una rápida conversión nos espera, aunque avisamos de que las imágenes no se nos muestran.
Pero ¿Qué ocurre si el documento pdf que pretendo convertir no está en la red y lo tenemos, por ejemplo, en el PC? En este caso lo que hay que hacer es enviarlo por email a Adobe como archivo adjunto.
Existen dos direcciones de correo a las que lo debemos dirigir dependiendo del formato en que lo queramos obtener:
– Para obtener un documento de texto, a la direccion pdf2txt@adobe.com
– Para obtener una copia en formato html hay que mandarlo a pdf2html@adobe.com
Adobe nos hará llegar un correo en poco tiempo donde se incluye el documento reconvertido al formato elegido.