Start / Home Assistant / KI / Home Assistant – Paperless-ngx + KI

Home Assistant – Paperless-ngx + KI

Viele von euch werden Paperless-ngx kennen. Dabei handelt es sich um ein Tool, um seine Dokumente zu digitalisieren und zu verwalten. Generell finde ich die Idee eines Dokumentenverwaltungssystems gut. Ich habe dafür bisher immer Synology Drive von meiner Synology NAS verwendet.
Die Dokumente habe ich mit Adobe Scan auf dem Smartphone abfotografiert und auf der NAS gespeichert.
Die Suche in Synology Drive war ganz gut, solange die OCR von Adobe Scan die Texte vernünftig erkannt hat. Das war in ca. 95 % der Fälle ganz gut.

Nun habe ich jedoch einen Gamechanger kennengelernt: Paperless-AI. Dies ist ein Addon für Paperless-ngx und hat einen RIESIGEN Vorteil: Ich kann darüber mit meinen Dokumenten chatten. Die ADAC-Mitgliedsnummer gerade nicht zur Hand? Einfach im Chat danach fragen. Du willst wissen, wie teuer dein Saugroboter war? Kein Problem. Und das Beste daran: Das alles ist in wenigen Momenten eingerichtet.

Voraussetzungen

Um das ganze zum Laufen zu bekommen, müssen einige Voraussetzungen getroffen werden:

  • Paperless-ngx muss installiert sein
  • Portainer muss installiert sein
  • Falls ihr mit OpenAI arbeiten wollt, benötigt ihr einen API-Key und müsst Geld auf das Konto laden (Keine Sorge: das kosten nur wenige Cent)
  • Falls ihr OpenAI nutzen wollt, muss euch klar sein, dass der Inhalt eurer Dokumente teilweise dort hochgeladen wird

Paperless-ngx installieren

Paperless-ngx bekommt ihr über den Add-on Store in Home Assistant. Fügt dafür folgendes Repository hinzu:

https://github.com/BenoitAnastay/home-assistant-addons-repository/

Anschließend könnt ihr Paperless-ngx installieren und konfigurieren. In der Konfiguration muss nur die Main Language eingetragen werden (Deu für Deutsch) und die Zeitzone, z.B.: Europe/Berlin.
Jetzt könnt ihr über die URL: http://homeassistant.local:4000 auf Paperless-ngx zugreifen.

Portainer installieren

Ich habe einen separaten Artikel über Portainer geschrieben: Hier klicken

Paperless-AI installieren

Jetzt, wo wir Portainer installiert haben, können wir auch Paperless-AI installieren. Klickt dafür links auf „Stack – New Stack“. Schreib einen sprechenden Namen hinein, z.B. paperless-ai und wählt „Web Editor“ aus. Schreibt den Text aus dem Video der Paperless-AI Github Seite hinein und klickt auf „Deploy the Stack“.
Paperless-AI könnt ihr jetzt über die URL http://homeassistant.local:3000 aufrufen.

Paperless-AI konfigurieren

Gebt nun eure Paperless-ngx Daten und OpenAI Daten ein. Die Paperless-ngx URL muss mit Port angegeben werden. Den Paperless-ngx API Token findet ihr in Paperless-ngx oben rechts auf eurem Usernamen und dann auf „Mein Profil“.

Tragt außerdem eure OpenAI Daten ein. Den API Key findet ihr unter https://platform.openai.com/api-keys. Dort könnt Ihre auf „Create new secret key“ klicken.

Unter „Add AI-processed tag to documents?“ empfehle ich euch „Yes“ auszuwählen und als Tag „ai-processed“ zu verwenden. Bei „AI Funktion Limits“ sollte alles ausgewählt werden, um die meisten Funktionen zu erhalten. Bei „Prompt Description“ könnt ihr auf den „Example“ Button klicken.

Dokumente hochladen

Jetzt läuft alles. Und weiter? Öffnet Paperless-ngx und zieht eins eurer Dokumente hinein. Es wird bei Paperless-ngx hochgeladen. Paperless-AI scannt alle 30 Minuten, ob es neue Dokumente gibt. Oder ihr klickt im Dashboard auf den „Scan now“ Button. Anschließend wird euer Dokument von der KI analysiert und mit Korrespondenten, Tags uvm. versehen. Jetzt könnt ihr in Paperless-ngx nach Schlagwörtern suchen.

Chat verwenden

Ich weiß, wir sind alle nur wegen des Chats hier. Klickt dafür in Paperless-AI auf „RAG Chat“. Falls der Status der einzelnen Punkte nicht grün ist, klickt auf „Start Indexing“. Es wird ein Index erstellt. Erst danach könnt ihr Fragen zu euren Dokumenten stellen.

Kosten

Je nachdem, wie viele Dokumente ihr von OpenAI analysieren lasst, können die Kosten höher oder niedriger ausfallen. Ich habe ca. 300 Seiten an Dokumente hochgeladen und es hat ca. 0,30 $ gekostet.

Troubleshooting

Ich hatte anfangs Probleme, dass ich die initiale Setup Ansicht angezeigt bekommen haben, wenn ich mich mit einem anderen Gerät zu Paperless-AI verbunden habe, oder meinen Cache gelöscht habe.
Das liegt wohl daran, dass die Container Konfiguration, wie sie auf der Paperless-AI Seite beschrieben wird, nicht ganz optimal für unser Szenario ist. Stattdessen habe ich mithilfe des Tools „Samba Share“ eine Freigabe erzeugt und im Stack gesagt, dass die Daten dort abgelegt werden sollen. Es wurde nur eine Zeile geändert.
Das angepasst Stack könnt ihr euch hier herunterladen.

Paperless-AI Stack

2,00 

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Shopping