Cómo convertir una serie de páginas HTML en un documento PDF

Hoy he visto en la lista de correos de Ubuntu en español un hilo iniciado por alguien que preguntaba por algún programa para convertiruna serie de archivos .html en un único PDF. La respuesta, muy simple y útil está en el uso del paquete htmldoc. Para proceder a convertir archivos, sólo hay que ejecutar:

$ htmldoc --webpage archivo1.html archivo2.html -f resultado.pdf

El archivo de salida no tiene por qué ser PDF; puede ser, por ej: un sólo fichero HTML que contiene a todos los demás.

$ htmldoc Archivo1.html Archivo2.html -f unidos.html

Tengo que consultar más información sobre este programa, pero supongo que aceptará sin problemas archivos de texto simple e imágenes.

Este programa se puede instalar en un servidor web; por ej, PDF-o-matic hace uso de él para convertir la página que le pases a PDF (y puedes ver el código fuente del script PHP aquí).

PD: en el mismo hilo, se mencionó este artículo, que trata de cómo configurar OpenOffice como servidor y convierta los ficheros que le enviemos a PDF.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: