Paperless-ngx, almacenar y ordenar documentos

En Software por

A veces me encuentro con programas de código abierto que son auténticas joyas, ofrecen todo lo que necesita el usuario y de forma totalmente gratuita. En este caso el software que me he encontrado mientras revisaba la sección de r/selfhosted de Reddit es Paperless-ngx.

Paperless-ngx logo

A modo de resumen, Paperless-ngx es un software que nos permite gestionar documentos, de tal forma que se almacenan y se indexa su contenido para después realizar búsquedas precisas y mantener todo con un nivel de organización y accesibilidad máximo.

No he visto mucha información en español describiendo las virtudes Paperless , por lo que a continuación, explicaré más en profundidad que utilidades tiene y por qué se ha convertido en un software imprescindible para mí.

Paperless-ngx uno de los mejores softwares de organización de documentación o quizás deberíamos decir el mejor.

Personalmente tenía los documentos organizados en el disco duro, creando carpetas y eligiendo bien los nombres de los archivos para que una vez almacenados y olvidados, pudiese recuperar la información lo más rápido posible. Este sistema está muy lejos de ser perfecto, incluso me atrevería a decir que deja de ser funcional cuando almacenas una cantidad de información relevante.

Es aquí donde entra en juego nuestro protagonista de hoy, Paperless-ngx, una herramienta gratuita y de código abierto que nos ofrece una experiencia de organización de documentos muy intuitiva, rápida, accesible y eficaz.

Requisitos para una instalación de Paperless-ngx.

Lo primero que debemos saber es que necesitamos instalarlo ya sea en un servidor remoto o en nuestro PC. Hace uso de la tecnología de Python para crear una interfaz web desde la que acceder a todas las funcionalidades de esta herramienta.

Recomiendo encarecidamente el método de instalación con el script de Docker, ya que es la forma más sencilla de instalar Paperpless. El único inconveniente de este método es que debemos tener instalado en nuestro sistema Docker, algo también sencillo si seguimos la documentación oficial para cada sistema operativo.

Las instrucciones de instalación de Paperless-ngx las encontráis en la página de documentación oficial.

Cargando nuestro primer documento en Paperless

Añadir un nuevo documento es algo tan sencillo como arrastrar el documento a la interfaz web de Paperless-ngx y listo. La herramienta se encargará de crear una miniatura del documento, extraer metadatos, extraer el texto (dispones de varios métodos como el uso de la API de OCRmyPDF, el uso del motor de OCR Tesseract, etc), añadir notas, establecer permisos, etc.

Cada documento cargado cuenta con la posibilidad de añadir o editar diferentes características para que la organización sea máxima. Podríamos decir que el resultado final es un motor de búsqueda optimizado para nuestros documentos y recuperar la información en cualquier momento.

paperless-ngx interfaz web

¿Qué posibilidades nos ofrece Paperless-ngx y por qué es tan buen haciendo su trabajo?

  • Lo primero que nos permite Paperless-ngx es mantener organizada nuestra biblioteca de documentos en los principales formatos (PDF, Office, .txt, imágenes, etc). El contenido se examina y se indexa de forma que la búsqueda y recuperación de la información es más precisa.
  • Es un sistema multiusuario, permite crear diferentes usuarios y ajustar permisos con grupos de usuario. Por ejemplo, se puede crear un grupo de usuarios que sólo pueden leer documentos, pero no subir nuevos documentos o modificar los existentes.
  • Permite compartir los documentos con otras personas creando enlaces, incluso permite establecer una fecha de caducidad en la que el archivo se dejará de compartir.
  • Permite descargar los ficheros originales, por lo que también funciona como un sistema de backup o respaldo de documentos.
  • Se pueden añadir etiquetas que además de clasificar el contenido de los documentos también permite afinar los permisos de acceso de los usuarios. Las etiquetas es una de las herramientas más poderosas de Paperless-ngx.
  • Se puede establecer otra jerarquía de clasificación denominada “Tipo de documento” que nos permite afinar más los filtros de búsqueda, así como la gestión de los permisos.
  • Permite añadir metadatos a los archivos denominados “Campos personalizados”.
  • Permite establecer un “Interlocutor” que hace referencia a la persona, empresa o institución que ha creado el documento o que lo ha publicado.
  • Se pueden crear flujos de trabajo con “Activadores” (condiciones que desencadenan una acción) y “Acciones” (proceso de hacer algo). Por ejemplo, podemos crear un flujo de trabajo que añada etiquetas automáticamente.

Vemos que esta herramienta pone a nuestra disposición una funcionalidad muy flexible con gran cantidad de opciones que nos permitirán crear una biblioteca de documentación ordenada y accesible. En lo personal, desde que he descubierto Paperless-ngx, se ha convertido en una de las herramientas fundamentales para mí. Puedo decir sin ninguna duda, software 100% recomendado.