
Inhaltsverzeichnis
Nimm bei dir der Papierkram immer noch viel Raum ein? Dann könnte ein digitales Dokumentenmanagement (DMS) eine echte Erleichterung für dich sein. Rechnungen, Verträge, Anleitungen oder persönliche Unterlagen – all das sauber digital zu archivieren, spart Zeit, Platz und Nerven. Für Selbsthoster gibt es mit Paperless NGX eine besonders leistungsfähige Open-Source-Lösung, die sich flexibel an individuelle Anforderungen anpassen lässt. In diesem Beitrag zeige ich, wie ich Paperless NGX seit mehreren Jahren im Alltag nutze, welche Automatisierungen ich implementiert habe und warum ich von diesem System überzeugt bin.
Was ist Paperless NGX?
Paperless NGX ist ein modernes, aktives Fork des ursprünglichen Paperless-Projekts und bietet eine umfassende Plattform für die Digitalisierung, Organisation und Archivierung von Dokumenten. Die Anwendung bringt eine webbasierte Benutzeroberfläche, automatische Texterkennung (OCR), Machine-Learning-gestützte Klassifikation und eine REST-API mit. Damit eignet sie sich ideal für Selbsthoster, die ein leistungsfähiges, selbstbestimmtes DMS aufbauen wollen.
Mein Setup im Alltag
Dokumenteneingang automatisieren
Ein zentraler Punkt meines Workflows ist der automatisierte Dokumenteneingang. Ich nutze sowohl einen Multifunktionsdrucker mit Einzugsscanner als auch einen Flachbettscanner. Beide Geräte schicken ihre Scans per SMB in einen sogenannten Hotfolder auf meinem Server. Paperless NGX überwacht diesen Ordner kontinuierlich. Sobald neue Dokumente erkannt werden, beginnt die Verarbeitung automatisch:
- OCR-Texterkennung wird durchgeführt
- PDF-Dateien werden analysiert und gespeichert
- Metadaten wie Datum, Dokumententyp oder Absender werden extrahiert
Das Resultat: Innerhalb weniger Minuten nach dem Scannen sind die Dokumente auffindbar, klassifiziert und durchsuchbar im System.
Intelligente Klassifikation dank Machine Learning
Besonders beeindruckend finde ich die automatische Klassifikation mittels Machine Learning. Paperless NGX lernt aus meinen Korrekturen und verbessert mit der Zeit die Erkennung:
- Rechnungen werden korrekt als solche erkannt
- Absender werden identifiziert und zugeordnet
- Dokumente werden passenden Tags oder Korrespondenzpartnern zugewiesen
Die Trefferquote ist mittlerweile so hoch, dass ich nur noch selten manuell eingreifen muss. Gerade bei wiederkehrenden Dokumenten wie Stromrechnungen, Versicherungsunterlagen oder Bankmitteilungen funktioniert das hervorragend.
E-Mail-Integration
Zusätzlich zum Scan-Workflow lasse ich auch E-Mails verarbeiten. Dafür prüft ein Script meine E-Mail-Konten auf eingehende Nachrichten mit Anhang. Bei bestimmten Regeln (z. B. Absender oder Betreff enthält "Rechnung") wird das PDF extrahiert und in den Hotfolder gelegt. So landen auch rein digitale Rechnungen automatisch im DMS.
Zugriff überall: Mobil, sicher, performant
Mobilzugriff per App
Die Paperless-NGX-Weboberfläche ist responsive und funktioniert auch mobil gut. Zusätzlich nutze ich eine dedizierte App, um auch unterwegs Dokumente einzusehen oder zu recherchieren. Gerade bei Handwerkerterminen oder im Gespräch mit Versicherungen ist das extrem hilfreich.
Sicherheit durch VPN
Sicherheit ist für mich ein zentrales Thema. Mein Paperless-NGX-System ist nicht öffentlich erreichbar. Der Zugriff erfolgt ausschließlich über ein VPN, das meine Geräte mit meinem Heimnetz verbindet. So ist das System effektiv abgeschottet, ohne auf Komfort zu verzichten.
Erweiterbarkeit durch API und Automatisierung
Die Paperless NGX API im Einsatz
Ein weiteres Highlight ist die umfangreiche API, die Paperless NGX zur Verfügung stellt. Ich nutze sie unter anderem, um meinen privaten AI-Agenten mit Dokumenten zu versorgen. Dieser kann automatisiert Dokumente analysieren, zusammenfassen oder weiterverarbeiten. Denkbar wären hier auch Reminder- oder To-do-Generierung aus Inhalten.
Die API ermöglicht viele weitere Szenarien, z. B. die Integration in Home-Assistant, das automatische Tagging von Dokumenten auf Basis externer Daten oder die Erstellung individueller Berichte. Auch in Low-Code Tools wie n8n lässt sich Paperless-NGX durch die REST API sehr schnell einbinden.
Installation & Betrieb in Docker und LXC
Paperless NGX lässt sich sehr einfach via Docker betreiben. Ich nutze es in einem LXC-Container auf meinem Proxmox-Host. Die Kombination aus Containerisierung und Docker macht das Setup portabel, wartungsarm und stabil. Updates sind schnell eingespielt und dank des separaten Datenvolumens bleiben meine Dokumente unangetastet.
In meinem Docker Setup habe ich einmal Paperless selbst als Dienst laufen.
Für den Hotfolder starte ich zusätzlich einen kleinen Samba Server. In meinem Scanner und meinen Dokumentenscanner habe ich den SMB Server als Laufwerk hinterlegt. Damit landen dann alle Scans direkt im LXC Container und können von Paperless direkt verarbeitet werden.
Hier mein Docker Setup:
services:
broker:
image: docker.io/library/redis:7
restart: unless-stopped
volumes:
- redisdata:/data
logging:
driver: "journald"
paperless:
image: ghcr.io/paperless-ngx/paperless-ngx:latest
restart: unless-stopped
user: paperless
depends_on:
- broker
healthcheck:
test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
interval: 30s
timeout: 10s
retries: 5
expose:
- 8000
volumes:
- ./volumes/data:/usr/src/paperless/data
- ./volumes/media:/usr/src/paperless/media
- ./volumes/export:/usr/src/paperless/export
- ./samba-shares/paperless-consume/:/usr/src/paperless/consume:rw
env_file: paperless.env
logging:
driver: "journald"
webserver:
image: nginx:alpine
restart: unless-stopped
ports:
- "80:80"
- "443:443"
volumes:
- ./nginx.conf:/etc/nginx/nginx.conf
- /etc/letsencrypt:/etc/letsencrypt:ro
logging:
driver: "journald"
# ---------------------------------------------
# SAMBA
# ---------------------------------------------
#
# https://hub.docker.com/r/elswork/samba
#
samba:
image: elswork/samba
container_name: samba
restart: always
ports:
- "139:139/tcp"
- "445:445/tcp"
volumes:
- ./samba-shares:/samba-shares:rw
environment:
- TZ=Europe/Berlin
command: >
-u "1000:1000:paperless:paperless:paperless"
-s "paperless-consume:/samba-shares/paperless-consume:rw:paperless"
logging:
driver: "journald"
volumes:
redisdata:
Fazit
Nach mehreren Jahren im Einsatz kann ich sagen: Paperless NGX ist für mich die ideale Lösung für digitales Dokumentenmanagement im Selbsthosting. Es ist flexibel, performant, datenschutzfreundlich und extrem hilfreich im Alltag. Die automatische Klassifikation, die E-Mail-Integration und die App-Nutzung machen es zu einem echten Alltagshelfer. Wer ein DMS sucht, das sich gut selbst betreiben und erweitern lässt, sollte Paperless NGX definitiv ausprobieren.