GEDBAS Jahresrückblick 2019

Am Ende des Jahres wird es mal wieder Zeit, einen Blick auf die bei GEDBAS, unserer Genealogischen Datenbank, hochgeladenen GEDCOM-Dateien zu werfen. Da im Laufe des Jahres über 2.000 GEDCOM-Dateien von genealogisch Forschenden hochgeladen wurden, spiegeln die Beobachtungen vermutlich recht gut wider, was bei den Genealogieprogrammen in Deutschland gerade vor sich geht.

In diesem Beitrag soll es hauptsächlich um die hochgeladenen GEDCOM-Dateien gehen, weitere Zahlen zur Nutzung von GEDBAS findet man im Blog-Beitrag GEDBAS mit mehr als 20 Millionen Personen.

Häufigste Genealogie-Programme

Hier ist die Liste, mit welchen Programmen die 2019 hochgeladenen GEDCOM-Dateien erstellt wurden:

Mit großem Abstand liegt Ahnenblatt vorne und kann damit seinen Spitzenplatz auch dieses Jahr wieder behaupten. Insgesamt gibt es wenig Bewegung auf den Spitzenplätzen. Immer wieder erstaunt bin ich, dass PAF noch immer zu den am häufigsten verwendeten Programmen zählt, wurde doch die Entwicklung bereits im Jahr 2013 eingestellt.

Anzumerken sei jedoch, dass diese Rangliste nur die Anzahl der bei GEDBAS hochgeladenen Dateien berücksichtigen kann. Möglicherweise sind also die Ahnenblatt-Nutzer nur besonders fleißig beim Veröffentlichen ihrer Ergebnisse. Allerdings war auch bei der Umfrage zur Nutzung von Genealogieprogrammen in der Computergenealogie 2018/3 Ahnenblatt das mit Abstand am häufigsten genannte Programm. Auf den nächsten Plätzen ergeben sich aber deutliche Unterschiede: Ancestry.com Family Trees wurde gar nicht genannt, der Family Tree Builder erst auf Platz 8. Das im Heft auf Platz 3 genannte Programm Stammbaumdrucker taucht in der GEDBAS-Liste hingegen erst auf den hinteren Plätzen auf.

GEDCOM-Versionen

Nach 20 Jahren mit dem Hinweis »Entwurf« wurde die GEDCOM-Version 5.5.1 Ende 2019 von FamilySearch endlich zum Standard erhoben. Die Version 5.5 wird damit aufs Altenteil geschickt. Die in der GEDCOM-L Mailingliste vertretenen Programmhersteller arbeiten schon lange mit der Version 5.5.1. Langsam aber sicher setzt sich die neue Version auch in der freien Wildbahn durch:

Obwohl die Version 5.3 schon im Januar 1996 abgelöst wurde, tauchten selbst 2010 noch GEDCOM-Dateien mit dieser Version bei GEDBAS auf. GEDCOM 5.5EL war ein Versuch von CompGen, GEDCOM um eine Ortsverwaltung zu erweitern. Mittlerweile ist es aber in die Arbeit der GEDCOM-L eingeflossen und wird dort im 5.5.1 GEDCOM-L Addendum (in 5.5.1 enthalten, da ohne eigene Versionskennzeichnung) fortgeführt.

Zeichensätze

GEDCOM erlaubt vier Möglichkeiten für den Zeichensatz: ANSEL, ASCII, UNICODE und UTF-8. Es gibt keinen Grund mehr, nicht UTF-8 zu verwenden. Nur damit – und bei UNICODE, das aber doppelt so viel Speicher belegt – können alle Zeichen übertragen werden.

ASCII ist eigentlich nur dann sinnvoll, wenn man sich ausschließlich im englisch-sprachigen Raum bewegt, denn schon deutsche Umlaute lassen sich damit nicht darstellen. Dennoch gibt es sogar ein deutsches Programm, das 2019 noch solche Dateien erzeugt: Dynas Tree (Version 0340.C09).

ANSEL wurde im Februar 2013 zurückgezogen. Trotzdem gibt es auch sechs Jahre später noch zahlreiche ANSEL-kodierte GEDCOM-Dateien.

Während MACINTOSH zum Glück seit 2015 ausgestorben zu sein scheint, halten sich einige der ungültigen Varianten hartnäckig. Alle Dateien mit der ungültigen Angabe WINDOWS stammen von Der Stammbaum 12, diejenigen mit der Angabe IBM WINDOWS von EasyTree V8.0. Eine Datei mit der Angabe IBMPC stammt von dem Programm GenProfi 99 Standard. Letztes Jahr wurden noch ein paar IBMPC-Dateien von dem Programm Family Tree Maker for Windows 5.00 hochgeladen – ein ähnlicher Software-Dinosaurier.

Dateigrößen

Über das Anwachsen der GEDCOM-Dateien hatte ich schon mehrfach berichtet. Auch 2019 hat sich dieser Trend fortgesetzt.

Die 75%-Linie hat mittlerweile fast die 3 MB erreicht. Das heißt, ein Viertel der bei GEDBAS hochgeladenen GEDCOM-Dateien ist mehr als 3 MB groß. Dass der Mittelwert so stark steigt, deutet auf einige sehr große Dateien hin. Das folgende Diagramm macht dies deutlich. Dann versteht man auch, warum ich manchmal von »Gigantomanie« bei GEDCOM-Dateien spreche:

Wie kommen solche extremen Größen zustanden? Vermutlich nur durch »Jäger und Sammler«, die von überall Daten zusammenkopieren. Der MyHeritage Family Tree Builder macht das Übernehmen von Daten offenbar besonders leicht, kennzeichnet die kopierten Daten aber auch gut. So ist mir eine Datei aufgefallen, die Daten von nicht weniger als 289 anderen Stammbäumen zusammenträgt.

Aktualisieren der Daten

Wie oft werden Daten bei GEDBAS aktualisiert? 80% der 2019 hochgeladenen Dateien wurden bislang nicht aktualisiert. 16% der Dateien wurde etwa monatlich aktualisiert. Eine wöchentliche Aktualisierung nehmen 3% der Nutzer vor. Und dann gibt es noch diejenigen, die jede kleinste Änderung mitteilen möchten: 14 Nutzer haben über 100 Mal ihre Datei aktualisiert. Den Vogel schießt jemand mit 587 Änderungen ab – mehr als eine Änderung pro Tag.