• Link zu Facebook
  • Link zu Instagram
  • Link zu Youtube
  • Sitemap
  • Downloadbereich
  • Blog
Verein für Computergenealogie e.V. (CompGen)
  • Anmeldung
  • Recherchieren
    • Datenbanken
    • GenWiki
    • Blog-Archiv
    • Namensverbreitungskarte
  • Kommunizieren
    • Veranstaltungen
    • Discourse
    • Mailinglisten
    • Forum
    • Social Media
  • Informieren
    • COMPUTERGENEALOGIE
    • FAMILIENFORSCHUNG
    • CompGen-Blog
    • DigiBib
  • Über uns
    • Ziele
    • Satzung
    • Kooperationen
    • Mitmachen
    • Mitgliedschaft
    • Spenden
    • Vorstand
    • IT-Ressort
  • Kontakt
  • Menü Menü
2017-03-06_Captcha.png

DES – Captchas

6. März 2017/in DES Datenerfassungssystem/von Jesper Zedlitz

Seit einigen Wochen verwenden wir an einigen Stellen im genealogy.net Captchas. Üblicherweise begegnen einem Captchas in Form verzerrter Zahlen- und Buchstabenkombinationen z.B. beim Anmelden bei einem Newsletter. Damit soll nachgewiesen werden, dass ein Mensch vor dem Computer sitzt und nicht etwa ein Programm hundertfache Anmeldungen zum Spamversenden vornimmt.

Unsere Captchas sehen ein wenig anders aus, denn neben dem Ziel der Abwehr von automatischen Massenbenutzungen wollen wir gleichzeitig auch die Eingaben sinnvoll nutzen. Als erste Daten haben wir dazu die Geburtsdaten aus den deutschen Verlustlisten des 1. Weltkriegs ausgewählt.

Der Nutzer bekommt zwei Schnipsel mit Einträgen aus den Verlustlisten angezeigt, z.B. so

Die DES-Captcha Eingabemaske

Der Trick besteht darin, dass wir bei einem der Einträge bereits die richtige Lösung kennen. Mal ist es der erste, mal ist es ist der zweite Eintrag. Auf diese Weise können wir überprüfen, dass tatsächlich ein Mensch die Lösung eingegeben hat. Ist der Kontrolleintrag richtig, so liegt die Vermutung nahe, dass auch das zweite (bislang unbekannte) Datum richtig eingegeben wurde. Die Eingabe speichern wir ab. Damit eine gute Datenqualität erreicht wird, reicht uns jedoch nicht eine einzige Eingabe eines unbekannten Datums, sondern es muss drei Mal das gleiche Datum eingegeben werden. Werden unterschiedliche Datumsangaben eingegeben, muss ein Feld entsprechend häufiger bearbeitet werden, bis das Datum übernommen wird.

Ich habe mich gefragt, wie oft das klappt. Reichen drei identische Eingaben oder geben die Nutzer zu viele unterschiedliche Werte ein? Dazu habe ich mir 1.500 fertig bearbeitete Einträge angesehen. Insgesamt wurden dabei 4.810 Eingaben getätigt (wie oben geschildert: jeder Eintrag mindestens drei Mal, bei Abweichungen auch häufiger). Dabei hat sich ergeben, dass bei 83,3% der Einträge drei identische Eingaben gemacht wurden. Bei 13,9% gab es eine abweichende Eingabe, es waren also vier Versuche notwendig. Lediglich bei 2,8% der Einträge waren mehr als fünf Versuche erforderlich. Das Verfahren funktioniert also gut, die meisten Nutzer geben ein richtiges Datum ein.

Diagramm, das die Anzahl benötigter Eingaben zeigt, bis ein Captcha akzeptiert wurde

 

Welche Fehler werden am häufigsten gemacht? Der mit 19.1% häufigste Fehler waren eingefügte Nullen bei Tag und Monat, die es im Original gar nicht gab. Ein paar Nutzer scheinen nicht verstanden zu haben, dass man das Geburtsdatum abschreiben soll und haben stattdessen den Namen noch einmal abgeschrieben. Das war bei 7% der Eingaben der Fall. Es folgen einige Zahlendreher, wobei eine als 6 gelesene 5 der häufigste Fall (5%) war. Es folgen 9 gelesen als 8, 3 gelesen als 2, 8 gelesen als 9 und 5 gelesen als 3 (jeweils aber weniger als 3% Vorkommen).

 

Wenn ein Eintrag nicht zu entziffern ist, hat man die Möglichkeit, sich ein neues Captcha geben zu lassen. Wurde ein Eintrag zu oft als unlesbar gemeldet, wird er aus der Erfassung genommen. Es besteht das Risiko, dass auch ein gut lesbarer Eintrag fälschlicherweise als unlesbar markiert wird. Um dies zu untersuchen, habe ich mir angesehen, wie oft die fertigen Einträge als fehlerhaft gemeldet wurden:

Wie oft wurde ein eigentlich lesbares Bild als "unlesbar" gemeldet?

Fast die Hälfte der Einträge wurde (korrekt) nie als “unlesbar” gemeldet. Etwa ein Viertel wurde einmal, 14% wurden zwei Mal, 6.8% drei Mal  und 4.1% vier oder mehrere Male als angeblich unlesbar gemeldet. In den meisten Fällen haben die Nutzer also richtig entschieden, ob ein Eintrag unlesbar ist. Es lohnt sich aber trotzdem, nochmal einen Blick auf die abgelehnten Einträge zu werfen.

 

(Dr. Jesper Zedlitz)

Eintrag teilen
  • Teilen auf Facebook
  • Teilen auf WhatsApp
  • Teilen auf Pinterest
  • Teilen auf LinkedIn
  • Teilen auf Tumblr
  • Teilen auf Reddit
  • Per E-Mail teilen
https://www.compgen.de/wp-content/uploads/2018/04/2017-03-06_Captcha.png 150 545 Jesper Zedlitz https://www.compgen.de/wp-content/uploads/2019/01/CG-Logo02-340_156px-200x92.png Jesper Zedlitz2017-03-06 10:05:342022-03-26 15:09:25DES – Captchas
Diskutiere diesen Beitrag in unserer Community

RSS Neu auf Discourse

  • Digital genealogy - 16. Juni 2025
  • Zugriff auf Zeitschrift Computer Genealogie beim Pferdesportverlag 16. Juni 2025
  • Zugriff auf Zeitschrift Computer Genealogie beim Pferdesportverlag 16. Juni 2025
  • KÖSTER oo SCHULZ aus RFendsburg 16. Juni 2025
  • Anbindung ans Fediverse 16. Juni 2025

RSS Angesagte Themen

  • Transportliste Landkreis Breslau Nr. 394 Breslau-Warendorf
  • Genanntnamen
  • Wann ein OFB Lauban?
  • Transportlisten 06/1946
  • Statistik zu den Mitgliedern im Verein für Computergenealogie

Filter Blogbeiträge nach Thema

Wähle Beiträge aus Monat

Newsletter

Sie können sich einmal wöchentlich
den CompGen-Blog Newsletter
per E-Mail zuschicken lassen.
Newsletter abonnieren
Newsletter abbestellen?
Passwort vergessen?

News-Redaktion

Anregungen oder Rückmeldungen zu Website und Blog gerne an news@genealogy.net

Schlagwörter

Ahnenblatt Ahnenforschung Ancestry Archion Berlin Brandenburg Citizen Science CompGen DAGV DES Digitalisierung Discourse DNA Familienforschung FamilySearch Frankreich Friedhof GEDCOM Genealogentag Genealogie GenWiki Hessen Juden Kalender Kirchenbücher Köln Landesarchiv NRW Leipzig MyHeritage Niederlande Niedersachsen Ortsfamilienbuch Personenstandsregister Polen RootsTech Sachsen Sachsen-Anhalt Schweden Transkribus Wochenvorschau YouTube Zoom-Meeting Zoom-Meetings Österreich Österreich-Ungarn

Du möchtest den Verein für Computergenealogie unterstützen? Das freut uns!

Mitmachen... Mitglied werden... Jetzt spenden...
© Copyright - Verein für Computergenealogie e.V. (CompGen) - powered by Enfold WordPress Theme
  • Impressum
  • Datenschutz
Link to: GOV – neue Kartenansicht Link to: GOV – neue Kartenansicht GOV – neue Kartenansicht Link to: Newsletter 2017/03 Link to: Newsletter 2017/03 Newsletter 2017/03
Nach oben scrollen Nach oben scrollen Nach oben scrollen