Elektronische Kassenbons – Teil 1

Vor zwei/drei Wochen veröffentlichte Daniel vom Hack the Plant Podcast und Schrankmonster Blog, eine Nachricht, dass er an einem Projekt arbeitet um die eBons auszulesen und die Informationen wegzuschreiben. Das hat er vor Kurzem in diesem Blog Post veröffentlicht.

Davon inspiriert und mit der Kaufland App ausgestattet, habe ich mich hingesetzt und das Ganze in Python nachgebaut. Und es war der Horror.

Angefangen mit dem Problem, dass es keine Möglichkeit in der App gibt die Bons per Email automatisch zu verschicken. Also kann man diese nur herunterladen und abspeichern. Oder ich hätte irgendwie die Netzwerkkommunikation der App abgefangen. Aber das habe ich mir für später aufgehoben. Beim Abspeichern wird dann auch das aktuelle Datum und Uhrzeit als Dateiname verwendet. D.h. man kann nicht erkennen, welchen Bon man schon gespeichert hat und welchen nicht. Ich habe jetzt viele doppelte PDFs im Ordner.

Das nächste Problem war die PDFs einzulesen und die Daten zu extrahieren, denn die PDFs sind nicht lesbar es sind Bilder. Was mich zu einer Testorgie mit OCR Software Paketen gebracht hat. An Ende bin ich bei pytesseract gelandet. Leider muss dafür auf dem Linux Tesseract installiert sein. Aber das ist ja auch kein Problem, nur fällt jetzt Windows als OS erstmal aus. Nach diversen Einstellungen haben ich dann doch eine Lösung gefunden. Und so kann das Skript jetzt auch die Bons einlesen und sogar kleine Scanfehler erkennen.

Der Rest sollte Makulatur sein. Aus den Summen, wenn man z.B. mehrere Packungen gekauft hat, wieder Einzelpreise berechnen. Und dann alles in die Influx schieben. Jedoch ist mir dann aufgefallen, dass durch die OCR manche Produkte doppelt vorkommen, wenn z.B. ein Leerzeichen nicht sauber erkannt wird. Und so sind das wieder Kleinigkeiten die ich noch ausbessern muss.

Als alles lief, wollte ich das Skript auf meinem Raspi 3 zum laufen bringen, denn auf dem läuft ja auch die Influx und mein PiHole. Der läuft eh immer und ich muss ja deswegen nicht mein Rechner dafür anwerfen. Aber da habe ich die Rechnung nicht mit dem Prozessor des Raspi gemacht. Leider geht dieser komplett in die Knie, wenn pytesseract die Arbeit aufnimmt. Und zwar so arg, dass ich sogar kein Internet mehr habe, weil für PiHole zu wenig Ressourcen übrig bleiben. Ich habe dafür noch keine Lösung, und werde das Auslesen wohl weiterhin auf meinem Rechner durchführen.

Im Augenblick arbeite ich daran die Skripte sauber zu machen (also alle hardgecodeten Logins zu entfernen) damit ich alles nach Github werfen kann. Das stelle ich dann euch zur Verfügung. Und als nächstes sind dann die Lidl Bons dran.

Bei Fragen könnt ihr mich gerne kontaktieren. Hier in den Kommentare oder einfach auf Mastodon, Twitter oder auf dem Telegram Kanal.

Dune bei Man nerdet nie aus

Ich bin vor einiger Zeit auf den Podcast "Man nerdet nie aus" aufmerksam gemacht worden. Als erstes habe ich mir die Buffy Folge angehört und es hat mir sehr gut gefallen. Und als Zweites stand die Dune Folge an. Diese habe ich gerade zu Ende gehört. Und ich muss sagen, dass der Gast sehr gut rüber kam und auch recht kompetent klang. Ich kenne von Dune nur den David Lynch Film, den ich sehr gut fand, und den Neuen von Denis Villeneuve, den ich auch sehr gut fand, jedoch nicht als "DEN" Meilenstein der Filmgeschichte ansehe. Auf jeden Fall hat es echt Spaß gemacht den Beiden zuzuhören auch wenn heftig Film und Bücher gespoilert werden, aber davor wird ja auch gewarnt.

Nur gegen Ende bin ich ein wenig enttäuscht worden. Denn da hacken die Beiden auf Solo: A Star Wars Story ein. Und mich als Star Wars Fan hat das echt ein wenig getroffen. Aber es geht ja um Dune und nicht um Star Wars.

Star Wars Nachschub

So kann ein Sonntag immer sein. NFL geht wieder los, "meine" Dolphins sind mit einem 20:7 Sieg gestartet, und Disney hat die D23 Veranstaltung durchgeführt. Es sind viele neue Dinge angekündigt worden die alle irgendwie spannend sind. Meine Highlights betreffen aber das Star Wars Universum.
Angefangen mit dem letzten Trailer von Andor vor dem Serienstart in Kürze. Die Serie sieht so dunkel und dreckig aus, wie Solo: A Star Wars Story. Das gefällt mir und ist auch ein Grund warum ich Star Wars Star Trek vorziehe.

Und dann The Mandalorian Staffel 3. Ok, das war zu erwarten. Die Aussicht die Geschichte von Mandalore weiter erleben ist genial.
https://youtu.be/odnRRZKhNP

Aber die größte Überraschung für mich war die Ankündigung von Tales of the Jedi. Das habe ich überhaupt nicht vorher mitbekommen. Kurzgeschichten á la Star Wars: Visionen, aber im Star Wars: The Clone Wars Setting. Bestens!

Das wird eine aufregende kommende Zeit. Man darf ja auch nicht Ashoka und Bad Batch Staffel 2 vergessen.

Sprit Preise mitschreiben

Schon vor Wochen habe ich die API von Tankerkoenig.de entdeckt. Also habe ich "kurz" ein Python Skript geschrieben, dass mir stündlich den Preis vom E5 und E10 in eine Telegram Gruppe pusht. Zusätzlich habe ich vorausschauend die Werte auch in eine CSV Datei geschrieben.
Vor ein paar Tagen dann, habe ich mir ein Herz gefasst und ein etwas größeres Projekt angefangen. Es war lehrreich, denn trotz so vieler Tutorials bin ich immer wieder auf Probleme gestoßen.
Doch jetzt ist der Anfang vollbracht. Auf meinem zentralen Raspberry Pi läuft jetzt eine InfluxDB, Grafana und mein angepasstes Skript, dass mir alle 5 Minuten die Werte wegschreibt.
Ich bin noch am überlegen ob ich hier alles veröffentliche. Jedoch gibt es so viele Tutorials und ich habe nichts neu oder anders gemacht das dokumentationswürdig wäre.
Bei Fragen könnt ihr mich jedoch gerne kontaktieren. Hier in den Kommentare oder einfach auf Mastodon, Twitter oder auf meinen neuen Telegram Kanal.

TGiF! – Simsalabim

Heute geht es magisch zu. Ich liebe ja Zauber und Magie Shows. Und der Geek in mir liebt es herauszufinden wie der Trick funktioniert. Und nein, der Zauber verfliegt nicht wenn man weiß wie es geht.

Und damit ihr auf der nächsten Party glänzen könnt anbei ein Video von nem echt guten Trick mit guter Erklärung.

Ein schönes Wochenende wünsche ich euch.

iPod nackig

Ich bin kein so großer Apple Produktliebhaber. Ich fand/finde die Geräte immer etwas überteuert. Auch wenn der höhere Preis zum, ich sag mal, größten Teil gerechtfertigt ist, so hat man immer Lifestyle mit bezahlt.

Doch es gibt Apple Produkte, die auch in meinem Besitz gelangt sind. Und eines davon war ein Apple iPod Nano der 2. Generation. Ich war schon vom ersten Nano technisch angetan, aber da hat mir das zweifarbige Design nicht zugesagt. Und dann kam Gen 2 komplett in Grau. Und zack, war die Bestellung draußen gewesen. Und die ungeheuerlichen 8GB waren damals eh nicht zu schlagen bei MP3 Playern. Und was soll ich sagen, dass Teil liegt immer noch auf meinem Schreibtisch griffbereit. Das Plugin auf Windows für die Datenübertragung ist installiert und auf Linux habe ich gtkpod drauf. Und erst vor drei Wochen auf meiner Reise nach Rumänien war es mein treuer Begleiter.

Durch den Blogbeitrag von Jürgen bin ich auf folgenden Link gestoßen.
https://www.scanofthemonth.com/scans/ipod-evolution?utm_source=website&utm_medium=sharethisbtn&utm_campaign=ipod-evolution

Da werden iPods per CT Scan durchleuchtet. Im Video fängt ab 13:40 der Scan des iPod Nano an. Aber allein die Seite ist schon ein Hingucker. Und ja, es ist ein Gen 1, aber ich denke das der Gen 2 nicht arg viel anders aussieht.

Cyberhacker

Ich versuche schon seit längerem immer mal wieder mir das Zehnfingersystem beizubringen, aber im Stress des Jobs falle ich zurück in mein Sechsfingersystem zurück. Was gibt es denn Schöneres als vor einem Editor zu sitzen und mit 130 wpm Code auf den Bildschirm zu zaubern.

Da hakt es an zwei Punkten. 130 wpm und überhaupt eine Menge Code im Kopf zu haben, das man auch hinzaubern kann. Aber für diese Probleme gibt es Abhilfe.

https://hackertyper.net

Haut in die Tasten und genießt.

Catch me if you can

Ich liebe Special Effects. Besonders wenn sie auch nicht mit "normalen" Kameratricks und ner klasse Story kombiniert werden. Und das hat dieser Künstler sehr gut hinbekommen.
Übergänge galore und zum Schluss noch ne perfekte Loop.

TGiF! – Ein volles unendliches Hotel

Da gibt es ein kleines Gedankenexperiment um zu verdeutlichen wie "komisch" unendliche Zahlen sind. Das Experiment heißt Hilberts Hotel. Das Video erklärt im ersten Teil das Experiment. Und ab dann wird es noch komischer. Denn es wird erläutert wie in einem unendlichen Hotel doch nicht genug Zimmer frei sind.

Viel Spaß mit den resultierenden Kopfschmerzen.

Und ein schönes Wochenende.

TGiF! – was Linux fehlt

Jedes Jahr bring Brian Lunduke seinen Vortag "Linux Sucks" heraus. Ein nicht ganz ernst gemeinter Vortag über den aktuellen Status von Linux und warum es nicht schon längst alle anderen Betriebssystem verdrängt hat. Eigentlich kommt dieser Vortrag immer am Anfang des Jahres, aber öffentlich auf YouTube wird er erst immer viel später eingestellt.

Und was fehlt Linux jetzt? Ein Killerroboter. Im Vortrag schaut er sich die Betriebssysteme von Robotern an und bemerkt, dass keiner auf Linux läuft. Das nervt (it sucks).

Aber aus den hier erwähnten 2 Minuten ist der ganze Vortrag nicht schlecht. Eine gute Einstimmung ins Wochenende. Und natürlich könnt ihr auch auch die Vorträge der vergangenen Jahre anschauen.

Viel Spaß!