Französische Volkszählungen mit KI erschlossen
20 ausgewählte französische Volkszählungslisten aus verschiedenen Departementsarchiven aus der Zeit von 1836 bis 1936 wurden mit Hilfe künstlicher Intelligenz (KI) erschlossen. Mitarbeiter von TEKLIA, Paris, und dem Nationalen Institut für demographische Studien nutzten Methoden zur automatischer Handschriftenerkennung (HTR), der Erkennung der Tabellenstruktur und -inhalte, wie z.B. Namen, Alter, Berufe und veröffentlichten Ergebnisse und Methoden..
Damit konnten aus den ausgewählten Volkszählungen aus einem Jahrhundert die handschriftlich aufgezeichneten Daten aus über 450.000 Bildern ausgewertet und in einer Datenbank zugänglich gemacht werden. Das Beitragsbild (im Blog) zeigt die Titelseite der Volkszählung von Algelsheim, Arrondissement Colmar, Canton Neuf-Breisach. Unter diesem Link können die einzelnen Seiten angezeigt werden.
Projekt „Social Face of France“ (Socface)

Die wissenschaftliche Arbeit von Mélodie Boillet u.a. wurde für das Projekt „Social Face of France“ (Socface) erstellt, das Archivare, Demografen, Ökonomen, Historiker und Informatiker zusammenbringt, um gemeinsam Technologien für die groß angelegte Verarbeitung riesiger Mengen historischer Dokumente zu entwickeln.
Im Socface-Projekt wird eine Datenbank aller Personen erstellt, die zwischen 1836 und 1936 in Frankreich lebten. Die Daten dienen zur Analyse des sozialen Wandels im Laufe dieser Zeit; sie werden aber auch für die breite Öffentlichkeit im Open Access veröffentlicht. Damit können für die Familien- und Ahnenforschung in Frankreich auch Namen, Berufen, Adressen und Familienverknüpfungen gefunden werden. Ab 2026 soll die Plattform kostenlos für alle zugänglich sein, wie hier zu lesen ist.
TEKLIA, Firma für Automatische Dokumentenverarbeitung mit KI
Das 2015 gegründete KI-Softwareunternehmen TEKLIA entwickelt Lösungen zur Verarbeitung von Dokumenten und bietet Software für Optische Zeichenerkennung (OCR) und HTR an. Mit weiterer Software können Daten aus Texten und Tabellen extrahiert und auch Fotos und Videos automatisch ausgewertet werden. Mit Ocelus werden Texte automatisch erkannt und mit Arkindex strukturierte Dokumente verarbeitet.