• Link zu Facebook
  • Link zu Instagram
  • Link zu Youtube
  • Sitemap
  • Downloadbereich
  • Blog
Verein für Computergenealogie e.V. (CompGen)
  • Anmeldung
  • Recherchieren
    • Datenbanken
    • GenWiki
    • Blog-Archiv
    • Namensverbreitungskarte
  • Kommunizieren
    • Veranstaltungen
    • Discourse
    • Mailinglisten
    • Forum
    • Social Media
  • Informieren
    • COMPUTERGENEALOGIE
    • FAMILIENFORSCHUNG
    • CompGen-Blog
    • DigiBib
  • Über uns
    • Ziele
    • Satzung
    • Kooperationen
    • Mitmachen
    • Mitgliedschaft
    • Spenden
    • Vorstand
    • IT-Ressort
  • Kontakt
  • Menü Menü
GEDBAS Datenbank

Neuer Import für GEDBAS

16. April 2023/in GEDBAS/von Jesper Zedlitz

Bei GEDBAS, der Datenbank für genealogisch verknüpfte Daten des Vereins für Computergenealogie (CompGen), gab es hinter den Kulissen einen größeren Umbau. Das Verfahren zum Einlesen von GEDCOM-Dateien wurde geändert. Schon mehrfach hatte ich darüber berichtet. dass eine Gigantomanie bei der Größe der GEDCOM-Dateien zu beobachten ist. Dieser Trend hält mittlerweile über zehn Jahre an und nimmt eher zu als ab. Ob dahinter das Motto “Meins, meins!” (man muss es sich im Ton der Möwen aus dem Film “Findet Nemo” vorstellen) oder “Ich habe den größten! (Stammbaum)” steckt – ich weiß ich nicht. Mit seriöser genealogischer Forschung hat es aber meiner Meinung nach nicht viel zu tun, wenn ein Datenbestand innerhalb von einer Woche um 15.000 Personen anwächst. Oder ich bin einfach langsam beim Kirchenbuchauswerten geworden…

Warum muss der GEDBAS-Import geändert werden?

Das ist aber die Realität und daran musste ich nun auch GEDBAS anpassen. Es tauchten immer wieder GEDCOM-Dateien mit einer Größe von 100 MB und mehr auf, die mehrere 100.000 Personen beinhalten. Zu allem Überfluss scheinen auch noch die Leute mit den größten Dateien ihre Daten am häufigsten zu aktualisieren – manche mehrfach am Tag. Das bedeutete bisher das Löschen von tausenden Personeneinträgen, das Einlesen der GEDCOM-Datei, der Ablauf des Datenschutz-Algorithmus, das Abspeichern der Daten in der Datenbank, das Erzeugen eines Suchindex und am Ende ggf. noch das Benachrichtigen über (vermeintlich) neue Daten über die Alerts der Metasuche. So kam es immer öfter dazu, dass der Import von GEDBAS “verstopft” war, weil ein paar dicke Brocken auf den Import wartete und viele “normal” große Dateien dadurch warten mussten.

Neuer Import übernimmt nur geänderte Daten

Nun habe ich den Import so umgebaut, dass möglichst nur Änderungen an der GEDCOM-Datei übernommen werden. Also hinzugefügte Einträge, geänderte Einträge und gelöschte Einträge. Im Idealfall führt das zu einem Fall, den ich im Logfile beobachtet habe: die beim Update hochgeladene GEDCOM-Datei enthält 115.000 Personen, bei der Änderung wurden aber eigentlich nur vier Personen hinzugefügt und eine geändert. So ein Update läuft nun in wenigen Sekunden durch, statt unsere Systeme lange zu belasten.

Ganz perfekt ist die Lösung allerdings nicht. Das liegt an einer Eigenheit der GEDCOM-Spezifikation. Die Identifikatoren von Personen, Familien und Quellen können sich nämlich der Spezifikation zufolge jederzeit ändern. War unter dem Identifikator I50 eben noch Max Mustermann verzeichnet, kann beim nächsten Hochladen unter I50 plötzlich Tina Tester verzeichnet sein. Dann würde mein Algorithmus viele Änderungen bemerken, obwohl sich eigentlich an den Informationen gar nichts geändert hat. Zum Glück behalten aber die meisten Genealogieprogramme trotzdem beim GEDCOM-Export die Identifikatoren von Personen, Familien und Quellen bei, so dass der Import von GEDBAS in der Praxis gut funktioniert.

Ganz wichtig ist jedoch, dass man beim Aktualisieren einer Datei in GEDBAS auch die Funktion “Aktualisierung” verwendet. Löscht man die bisherige Datei und lädt anschließend eine neue Datei (unter neuer Nummer) hoch, funktioniert die effiziente Aktualisierung natürlich nicht.

Schlagworte: GEDCOM, Import
Eintrag teilen
  • Teilen auf Facebook
  • Teilen auf WhatsApp
  • Teilen auf Pinterest
  • Teilen auf LinkedIn
  • Teilen auf Tumblr
  • Teilen auf Reddit
  • Per E-Mail teilen
https://www.compgen.de/wp-content/uploads/2023/04/GEDBAS.png 331 901 Jesper Zedlitz https://www.compgen.de/wp-content/uploads/2019/01/CG-Logo02-340_156px-200x92.png Jesper Zedlitz2023-04-16 10:00:002023-04-15 22:30:12Neuer Import für GEDBAS
6 Kommentare

RSS Neu auf Discourse

  • Du oder Sie? Kleines Meinungsbild bitte 15. Juni 2025
  • Ortsfamilienbücher 15. Juni 2025
  • Lesehilfe und Suche: GILBER? 15. Juni 2025
  • Ortsfamilienbücher 15. Juni 2025
  • FN Pranga / Prange in Kniewenbruch Kr. Neustadt 15. Juni 2025

RSS Angesagte Themen

  • Transportliste Landkreis Breslau Nr. 394 Breslau-Warendorf
  • Genanntnamen
  • Wann ein OFB Lauban?
  • Transportlisten 06/1946
  • Statistik zu den Mitgliedern im Verein für Computergenealogie

Filter Blogbeiträge nach Thema

Wähle Beiträge aus Monat

Newsletter

Sie können sich einmal wöchentlich
den CompGen-Blog Newsletter
per E-Mail zuschicken lassen.
Newsletter abonnieren
Newsletter abbestellen?
Passwort vergessen?

News-Redaktion

Anregungen oder Rückmeldungen zu Website und Blog gerne an news@genealogy.net

Schlagwörter

Ahnenblatt Ahnenforschung Ancestry Archion Berlin Brandenburg Citizen Science CompGen DAGV DES Digitalisierung Discourse DNA Familienforschung FamilySearch Frankreich Friedhof GEDCOM Genealogentag Genealogie GenWiki Hessen Juden Kalender Kirchenbücher Köln Landesarchiv NRW Leipzig MyHeritage Niederlande Niedersachsen Ortsfamilienbuch Personenstandsregister Polen RootsTech Sachsen Sachsen-Anhalt Schweden Transkribus Wochenvorschau YouTube Zoom-Meeting Zoom-Meetings Österreich Österreich-Ungarn

Du möchtest den Verein für Computergenealogie unterstützen? Das freut uns!

Mitmachen... Mitglied werden... Jetzt spenden...

© Copyright - Verein für Computergenealogie e.V. (CompGen) - powered by Enfold WordPress Theme
  • Impressum
  • Datenschutz
Link to: Fünf fantastische Technik-Tricks zur Entschlüsselung der deutschen Handschrift Link to: Fünf fantastische Technik-Tricks zur Entschlüsselung der deutschen Handschrift Fünf fantastische Technik-Tricks zur Entschlüsselung der deutschen Handsc...Köpfe von Gerd Altmann CCO Link to: nestor: meinDigitalesArchiv.de Link to: nestor: meinDigitalesArchiv.de Books pixabay ninocare CC0nestor: meinDigitalesArchiv.de
Nach oben scrollen Nach oben scrollen Nach oben scrollen