• Link zu Facebook
  • Link zu Instagram
  • Link zu Youtube
  • Sitemap
  • Downloadbereich
  • Blog
Verein für Computergenealogie e.V. (CompGen)
  • Anmeldung
  • Recherchieren
    • Datenbanken
    • GenWiki
    • Blog-Archiv
    • Namensverbreitungskarte
  • Kommunizieren
    • Veranstaltungen
    • Discourse
    • Mailinglisten
    • Forum
    • Social Media
  • Informieren
    • COMPUTERGENEALOGIE
    • FAMILIENFORSCHUNG
    • CompGen-Blog
    • DigiBib
  • Über uns
    • Ziele
    • Satzung
    • Kooperationen
    • Mitmachen
    • Mitgliedschaft
    • Spenden
    • Vorstand
    • Kontakt
    • IT-Ressort
  • Menü Menü
BLF Sterbebilderprojekt

Verarbeitung von Sterbebildern mit KI beim BLF

26. Juli 2025/in Sterbebilder, Künstliche Intelligenz (KI)/von Günter Junkers

Schon im vergangenen Jahr war im Blog des Bayerischen Landesvereins für Familienkunde e.V. (BLF) ein Bericht über die automatisierte Verarbeitung von Sterbebildern mit KI zu lesen. Die BLF-Sterbebilder-Datenbank ist mit über 1,2 Millionen eingescannten Sterbebildern, wie man in Bayern die anderswo auch Toten- oder Partezettel genannten Trauerbildchen bezeichnet, eine der größten Sammlungen. Die Schwerpunkte liegen in Bayern und den Grenzregionen zu Österreich. Eine Suche in der Datenbank ist über einen Gasteingang kostenlos; sie ist auch in der Metasuche in den CompGen-Datenbanken eingebunden. Scans der Sterbebilder werden aber nur den Mitglieder des BLF und befreundeten Vereinen nach Registrierung angezeigt, allerdings nur dann, wenn es kein Urheberrecht an Bildern auf den Totenzetteln gibt.

Sterbebild
Sterbebild Otto Ablaßmeier 1890–1959
Quelle: WGfF-Totenzettelsammlung Slg. Rupprecht, Leichlingen

Dubletten durch Texterkennung identifizieren

Eins der Probleme bei der immer noch manuellen Erfassung der Namen, Daten und Orte war die immer größer werdende Anzahl der Dubletten, die nicht zum zweiten oder dritten Mal neu eingegeben werden sollte. Um dies zu vermeiden, hatte der Informatiker Josef Probst die Idee, den Text aus dem eingescannten Sterbebild mit einer Texterkennungssoftware zu lesen, so die abgedruckten Namen und Daten der verstorbenen Personen zu entziffern und sie dann mit den Daten in der Datenbank zu vergleichen. Stimmten Namen, Geburts- und Sterbedaten überein, konnte das Sterbebild von der weiteren Erfassung ausgeschlossen werden.

Josef Probst hat ein Python-Programm geschrieben, das die eingescannten Sterbebilder mit Hilfe der kostenlos verwendbaren Texterkennungssoftware Tesseract „liest“. Diese schon vor mehr als 30 Jahre entwickelte Software erkennt Textzeichen in verschiedenen Schrifttypen (z.B. Frakturschrift) und Sprachen. Archive und Bibliotheken benutzen die weiterentwickelte Software auf Basis von Tesseract zum Lesbar-Machen gedruckter Texte. Genau für diese Aufgabe wird Künstliche Intelligenz (KI) eingesetzt.

Hohe Trefferquote von Dubletten erreicht

Bei den Sterbebildern war das Problem zu bewältigen, dass nicht nur unterschiedliche Schriftarten das automatische Entziffern erschwerten. Es sollten auch Vorname, Familienname, Geburts- und Sterbedatum gelesen und identifiziert werden, um Duplikate auszuscheiden. Die weiteren Textzeilen sollten ignoriert werden. Das Programm von Josef Probst löst diese Aufgabe, indem die Geburts- und Sterbedaten mit einer hohen Trefferquote ausgelesen und mit den Inhalten in der Datenbank verglichen werden. Nur wenn ein Geburtsdatum fehlte, wurden Vor- und Nachname zusammen mit dem Sterbedatum zum Abgleich herangezogen.

Die Programmentwicklung wird sicher weitergehen, um auch die Erfassung von neuen Sterbebildern zu automatisieren, so dass nur noch eine Kontrolle der erfassten Daten nötig ist.

Eigene Versuche mit Tesseract und ChatPDF

Wer das kostenlose Texterkennungsprogramm Tesseract selbst installieren möchte, sei auf die Anleitung des Landschaftsverbandes Westfalen-Lippe verwiesen. Es gibt sicher weitere Wege, um das Programm für seine Zwecke einzusetzen. Wer das Programmpaket von PDF24 kennt oder installiert hat, weiß, dass darin auch die Texterkennung (OCR) von PDF-Dateien enthalten ist. Diese funktioniert übrigens auch mit Tesseract. Die Texterkennung wurde auch erfolgreich bei Grabsteinen von Billion Graves eingesetzt, wie wir hier im Blog des Vereins für Computergenealogie (CompGen) berichtet haben.

Ich habe den hier im Blog abgebildeten Totenzettel als PDF-Datei mit PDF24 per Texterkennung (OCR) lesen lassen und dann mit ChatPDF probiert, die Namen und Daten zu extrahieren. Diese KI-Software erlaubt es, zum Inhalt einer zuvor hochgeladenen PDF Fragen zu stellen. Der Chatbot hat den Text des Totenzettels gelesen und mir die folgende Frage beantwortet:

„Kann ich alle Informationen zur verstorbenen Person in einer detaillierten Tabelle erhalten, einschließlich des Geschlechts?“

Die geforderte Tabelle wurde vollständig und bis auf den durch die OCR falsch gelesenen Sterbeort richtig erstellt:

Die Blogredaktion ist an Euren Erfahrungen bei der Texterkennung und Weiterverarbeitung der erkannten Daten interessiert.
Beschreibt uns Eure Versuche!

Verein für Computergenealogie e.V. (CompGen)
Verein für Computergenealogie e.V. (CompGen)
@blog
Follow

CompGen – offen, vernetzt, geschichtsbegeistert!
WordPress im Fediverse – Bloggen ohne Grenzen – Reichweite ohne Ende!

2.223 Beiträge
225 Folgende

Folge Verein für Computergenealogie e.V. (CompGen)

Mein Profil

Kopiere mein Profil und füge es im Suchfeld deiner bevorzugten Fediverse-App oder deines bevorzugten Fediverse-Servers ein.

Dein Profil

Oder wenn du dein eigenes Profil kennst, können wir damit loslegen!
Schlagworte: Totenzettel, ChatPDF, Sterbebilder, Tesseract, BLF, PDF24, Texterkennung, Todesanzeigen, Grabsteine, Datenbank, KI, Python
Eintrag teilen
  • Teilen auf Facebook
  • Teilen auf WhatsApp
  • Teilen auf Pinterest
  • Teilen auf LinkedIn
  • Teilen auf Tumblr
  • Teilen auf Reddit
  • Per E-Mail teilen
https://www.compgen.de/wp-content/uploads/2025/07/BLF-Sterbebilderprojekt-1.jpg 507 1367 Günter Junkers https://www.compgen.de/wp-content/uploads/2019/01/CG-Logo02-340_156px-200x92.png Günter Junkers2025-07-26 13:40:002025-07-27 20:10:33Verarbeitung von Sterbebildern mit KI beim BLF
Diskutiere diesen Beitrag in unserer Community

RSS Neu auf Discourse

  • Hochzeit Hass °° Schweitzer in Schönberg 29. Juli 2025
  • Hochzeit Hass °° Schweitzer in Schönberg 29. Juli 2025
  • Dissertationslisten - neues DES-Projekt mit wiss.Kollaboration 28. Juli 2025
  • Umrechnung Datum 28. Juli 2025
  • Umrechnung Datum 28. Juli 2025

RSS Angesagte Themen

  • Verwirrender Hinweistext beim Anzeigen eines Quelltextes im unangemeldeten Zustand
  • Du oder Sie? Kleines Meinungsbild bitte
  • Transportliste Landkreis Breslau Nr. 394 Breslau-Warendorf
  • Genanntnamen
  • Wann ein OFB Lauban?

Filter Blogbeiträge nach Thema

Wähle Beiträge aus Monat

Newsletter

Sie können sich einmal wöchentlich
den CompGen-Blog Newsletter
per E-Mail zuschicken lassen.
Newsletter abonnieren
Newsletter abbestellen?
Passwort vergessen?

News-Redaktion

Anregungen oder Rückmeldungen zu Website und Blog gerne an news@genealogy.net

Schlagwörter

Ahnenblatt Ahnenforschung Ancestry Archion Berlin Brandenburg Bremen Citizen Science CompGen DAGV DES Digitalisierung Discourse DNA Familienforschung FamilySearch Frankreich GEDCOM Genealogentag Genealogie GenWiki Hessen Juden Kirchenbücher Köln Landesarchiv NRW Leipzig MyHeritage Niederlande Niedersachsen Ortsfamilienbuch Personenstandsregister Polen Rheinland-Pfalz RootsTech Sachsen Sachsen-Anhalt Schweden Transkribus Wochenvorschau YouTube Zoom-Meeting Zoom-Meetings Österreich Österreich-Ungarn

Du möchtest den Verein für Computergenealogie unterstützen? Das freut uns!

Mitmachen... Mitglied werden... Jetzt spenden...

© Copyright - Verein für Computergenealogie e.V. (CompGen) - powered by Enfold WordPress Theme
  • Impressum
  • Datenschutz
Link to: Zwischen Desktop und Plattform: Vergleich moderner Web-Genealogieprogramme Link to: Zwischen Desktop und Plattform: Vergleich moderner Web-Genealogieprogramme Zwischen Desktop und Plattform: Vergleich moderner Web-GenealogieprogrammeKI-Bild Zusammearbeit
Nach oben scrollen Nach oben scrollen Nach oben scrollen