Digitales Dokumentenmanagement mit Paperless NGX

Nimm bei dir der Papierkram immer noch viel Raum ein? Dann könnte ein digitales Dokumentenmanagement (DMS) eine echte Erleichterung für dich sein. Rechnungen, Verträge, Anleitungen oder persönliche Unterlagen – all das sauber digital zu archivieren, spart Zeit, Platz und Nerven. Für Selbsthoster gibt es mit Paperless NGX eine besonders leistungsfähige Open-Source-Lösung, die sich flexibel an individuelle Anforderungen anpassen lässt. In diesem Beitrag zeige ich, wie ich Paperless NGX seit mehreren Jahren im Alltag nutze, welche Automatisierungen ich implementiert habe und warum ich von diesem System überzeugt bin.

Was ist Paperless NGX?

Paperless NGX ist ein modernes, aktives Fork des ursprünglichen Paperless-Projekts und bietet eine umfassende Plattform für die Digitalisierung, Organisation und Archivierung von Dokumenten. Die Anwendung bringt eine webbasierte Benutzeroberfläche, automatische Texterkennung (OCR), Machine-Learning-gestützte Klassifikation und eine REST-API mit. Damit eignet sie sich ideal für Selbsthoster, die ein leistungsfähiges, selbstbestimmtes DMS aufbauen wollen.

Dokumentensuche

Mein Setup im Alltag

Dokumenteneingang automatisieren

Ein zentraler Punkt meines Workflows ist der automatisierte Dokumenteneingang. Ich nutze sowohl einen Multifunktionsdrucker mit Einzugsscanner als auch einen Flachbettscanner. Beide Geräte schicken ihre Scans per SMB in einen sogenannten Hotfolder auf meinem Server. Paperless NGX überwacht diesen Ordner kontinuierlich. Sobald neue Dokumente erkannt werden, beginnt die Verarbeitung automatisch:

  • OCR-Texterkennung wird durchgeführt
  • PDF-Dateien werden analysiert und gespeichert
  • Metadaten wie Datum, Dokumententyp oder Absender werden extrahiert

Das Resultat: Innerhalb weniger Minuten nach dem Scannen sind die Dokumente auffindbar, klassifiziert und durchsuchbar im System.

Intelligente Klassifikation dank Machine Learning

Besonders beeindruckend finde ich die automatische Klassifikation mittels Machine Learning. Paperless NGX lernt aus meinen Korrekturen und verbessert mit der Zeit die Erkennung:

  • Rechnungen werden korrekt als solche erkannt
  • Absender werden identifiziert und zugeordnet
  • Dokumente werden passenden Tags oder Korrespondenzpartnern zugewiesen

Die Trefferquote ist mittlerweile so hoch, dass ich nur noch selten manuell eingreifen muss. Gerade bei wiederkehrenden Dokumenten wie Stromrechnungen, Versicherungsunterlagen oder Bankmitteilungen funktioniert das hervorragend.

E-Mail-Integration

Zusätzlich zum Scan-Workflow lasse ich auch E-Mails verarbeiten. Dafür prüft ein Script meine E-Mail-Konten auf eingehende Nachrichten mit Anhang. Bei bestimmten Regeln (z. B. Absender oder Betreff enthält "Rechnung") wird das PDF extrahiert und in den Hotfolder gelegt. So landen auch rein digitale Rechnungen automatisch im DMS.

E-Mail Regeln

Zugriff überall: Mobil, sicher, performant

Mobilzugriff per App

Die Paperless-NGX-Weboberfläche ist responsive und funktioniert auch mobil gut. Zusätzlich nutze ich eine dedizierte App, um auch unterwegs Dokumente einzusehen oder zu recherchieren. Gerade bei Handwerkerterminen oder im Gespräch mit Versicherungen ist das extrem hilfreich.

Screenshot einer Android App in der nach "Magento" gesucht wird. Es werden gefunden Dokumente angezeigt.

Sicherheit durch VPN

Sicherheit ist für mich ein zentrales Thema. Mein Paperless-NGX-System ist nicht öffentlich erreichbar. Der Zugriff erfolgt ausschließlich über ein VPN, das meine Geräte mit meinem Heimnetz verbindet. So ist das System effektiv abgeschottet, ohne auf Komfort zu verzichten.

Erweiterbarkeit durch API und Automatisierung

Die Paperless NGX API im Einsatz

Ein weiteres Highlight ist die umfangreiche API, die Paperless NGX zur Verfügung stellt. Ich nutze sie unter anderem, um meinen privaten AI-Agenten mit Dokumenten zu versorgen. Dieser kann automatisiert Dokumente analysieren, zusammenfassen oder weiterverarbeiten. Denkbar wären hier auch Reminder- oder To-do-Generierung aus Inhalten.

Die API ermöglicht viele weitere Szenarien, z. B. die Integration in Home-Assistant, das automatische Tagging von Dokumenten auf Basis externer Daten oder die Erstellung individueller Berichte. Auch in Low-Code Tools wie n8n lässt sich Paperless-NGX durch die REST API sehr schnell einbinden.

Das Tool Bruno mit einer Anfrage mit einer offenen Anfrage an die Paperless NGX REST Schnittstelle

Installation & Betrieb in Docker und LXC

Paperless NGX lässt sich sehr einfach via Docker betreiben. Ich nutze es in einem LXC-Container auf meinem Proxmox-Host. Die Kombination aus Containerisierung und Docker macht das Setup portabel, wartungsarm und stabil. Updates sind schnell eingespielt und dank des separaten Datenvolumens bleiben meine Dokumente unangetastet.

In meinem Docker Setup habe ich einmal Paperless selbst als Dienst laufen.
Für den Hotfolder starte ich zusätzlich einen kleinen Samba Server. In meinem Scanner und meinen Dokumentenscanner habe ich den SMB Server als Laufwerk hinterlegt. Damit landen dann alle Scans direkt im LXC Container und können von Paperless direkt verarbeitet werden.

Hier mein Docker Setup:

services:
  broker:
    image: docker.io/library/redis:7
    restart: unless-stopped
    volumes:
      - redisdata:/data
    logging:
      driver: "journald"

  paperless:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    restart: unless-stopped
    user: paperless
    depends_on:
      - broker
    healthcheck:
      test: ["CMD", "curl", "-fs", "-S", "--max-time", "2",  "http://localhost:8000"]
      interval: 30s
      timeout: 10s
      retries: 5
    expose:
      - 8000
    volumes:
      - ./volumes/data:/usr/src/paperless/data
      - ./volumes/media:/usr/src/paperless/media
      - ./volumes/export:/usr/src/paperless/export
      - ./samba-shares/paperless-consume/:/usr/src/paperless/consume:rw
    env_file: paperless.env
    logging:
      driver: "journald"

  webserver:
    image: nginx:alpine
    restart: unless-stopped
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx.conf:/etc/nginx/nginx.conf
      - /etc/letsencrypt:/etc/letsencrypt:ro
    logging:
      driver: "journald"

  # ---------------------------------------------
  # SAMBA
  # ---------------------------------------------
  #
  # https://hub.docker.com/r/elswork/samba
  #
  samba:
    image: elswork/samba
    container_name: samba
    restart: always
    ports:
      - "139:139/tcp"
      - "445:445/tcp"
    volumes:
      - ./samba-shares:/samba-shares:rw
    environment:
      - TZ=Europe/Berlin
    command: >
      -u "1000:1000:paperless:paperless:paperless"
      -s "paperless-consume:/samba-shares/paperless-consume:rw:paperless"
    logging:
      driver: "journald"

volumes:
  redisdata:

Fazit

Nach mehreren Jahren im Einsatz kann ich sagen: Paperless NGX ist für mich die ideale Lösung für digitales Dokumentenmanagement im Selbsthosting. Es ist flexibel, performant, datenschutzfreundlich und extrem hilfreich im Alltag. Die automatische Klassifikation, die E-Mail-Integration und die App-Nutzung machen es zu einem echten Alltagshelfer. Wer ein DMS sucht, das sich gut selbst betreiben und erweitern lässt, sollte Paperless NGX definitiv ausprobieren.