MyHeritage verschleiert die Herkunft von Daten

In den monatlichen Update-Meldungen von MyHeritage taucht im Blog vom 3. bzw. 6. November 2020 auch eine deutsche Quelle auf: Die „Bremer Auswanderungslisten“ 1920-1939 mit 737.505 Einträgen. Tatsächlich sind es Schiffspassagierlisten, in denen auch Reisende aufgeführt sind, die keine Auswanderer sind. Dies zeigt das im Blog gebrachte Beispiel des in Bremen geborenen vierjährigen Selwyn Charles Cornelius-Wheeler, der im August 1927 mit seinen Eltern nach Southampton in England reist. (Charles wird später Schwiegervater von Boris Johnson während dessen 25 Jahre lang währenden Ehe mit der Tochter Marina Wheeler).

Mit der mißverständlichen Formulierung „Die Digitalisierung erfolgte im Einvernehmen zwischen der Bremer Handelskammer und der Bremer Gesellschaft für genealogische Untersuchungen“ wird der Eindruck erweckt, als habe MyHeritage für die Digitalisierung gesorgt. Zudem gibt es die genannte „Bremer Gesellschaft für genealogische Untersuchungen“ überhaupt nicht. Läßt man die Quelle anzeigen (Klick auf die Anführungszeichen links neben dem Druckersymbol unten auf der Suchergebnisseite), so erscheint als Quelle MyHeritage und nicht die Ursprungsdatenbank.

Bremer Passagierliste für Selwyn Charles Cornelius-Wheeler, später Schwiegervater von Boris Johnson

Die eigene Recherche ergab schnell, dass es sich bei den „Bremer Auswanderungslisten“ um die von Herbert Juling und Karl Wesling und den „Bremer E-Migranten-Mäusen“ erarbeitete Datenbank „Bremer Passagierlisten“ handelt. „Ein Gemeinschaftsprojekt mit der Handelskammer und dem Staatsarchiv Bremen“ wie es auf der Seite Passagierlisten.de heißt. Die Originaldatenbank wird auf einem privaten Server von Herbert Juling und Karl Wesling unter den Domains passagierlisten.de, passengerlists.de, public-juling.de/passagierlisten betrieben. Sie enthält noch weitere Daten aus Passagierlisten von 1907/08 und 1913/14 und aus einer Zettelkartei des deutschen Auslandsinstituts in Stuttgart. Besitzer der Original-Passagierlisten ist die Bremer Handelskammer, die Akten werden im Staatsarchiv aufbewahrt. Beteiligt waren bei der Erfassung auch Mitglieder der „MAUS – Gesellschaft für Familienforschung e.V.“ in Bremen. Hat MyHeritage die Daten aus der frei zugänglichen Datenbank kopiert und unter einem anderen Namen ohne genaue Quellenbezeichnung angeboten? Ist das vielleicht gar kein Einzelfall?

MyHeritage hat offensichtlich die mit einem Crawler systematisch kopierten Daten übernommen und in die eigene Datenbankstruktur überführt. Das nennt man Datenklau. Wie Herbert Juling mitteilte, hat MyHeritage im August angefragt, ob man die Daten der Passagierlisten übernehmen dürfe. Da waren sie aber schon längst seit mehreren Monaten hinter der Bezahlschranke einsehbar. Der Protest und die Forderung nach Löschen der Daten wurden ignoriert, stattdessen wurden die Daten kostenlos zugänglich gemacht. Diese Ersatzforderung der Bremer Gruppe wurde zwar erfüllt, aber nicht die nach genauen Angaben und Links zur Originalquelle. Die findet man nur, wenn man die Bilder der Schiffe anschauen möchte. Korrekt wäre bei allen Daten der Hinweis und Link auf die Originalseite – so wie es bei Ancestry oder FamilySearch praktiziert wird.

Nachtrag vom 17.11.2020: Die Daten der „Bremer Passagierlisten“ werden nicht mehr von MyHeritage angezeigt. Übriggeblieben sind nur die Passagierlisten von 1904-1914, die von FamilySearch stammen. Auch hier fehlt die richtige Quellenangabe „FamilySearch“ bzw. wie dort korrekt angegeben: Deutsches Ausland-Institut (Stuttgart) Bundesarchiv (Koblenz).