Ich brauche eine Liste mit gebräuchlichen Vornamen für Leute wie "Bill", "Gordon", "Jane" usw. Gibt es eine freie Liste mit vielen bekannten Namen, anstatt dass ich sie eingeben muss? Etwas, das ich leicht mit dem Programm parsen kann, um zum Beispiel ein Array auszufüllen?
Ich mache mir keine Sorgen:
Ich weiß Wikipedia hat eine Liste von beliebtesten Vornamen , aber das ist alles in einer HTML-Seite und mit schrecklicher Wiki-Syntax ausgestattet. Gibt es einen besseren Weg, um einige Beispieldaten zu erhalten, ohne scabape wikipedia screenen zu müssen?
Eine CSV aus der General Register Office of Scotland mit allen Vornamen, die dort 2007 registriert wurden.
Eine weitere große Gruppe von Vornamen im CSV-Format und SQL-Format zu (aber sie haben nicht gesagt, welche DB die SQL-Dumps).
GitHub-Seite mit den ersten 1000 Babynamen von 1880 bis 2009, die bereits in CSV-Dateien umgewandelt wurden für Sie von der Verwaltung für soziale Sicherheit .
CSV mit Babynamen und Bedeutungen von einer Princeton CS-Seite.
Das sollte genug sein, um Sie zu beginnen, würde ich denken.
Verwaltung für soziale Sicherheit - Jenseits der Top-1000-Namen-Datendateien
Dies ist eine umfassende Liste von Vornamen, die in den USA verwendet werden. Die Zip-Dateien enthalten nationale und bundesstaatliche Daten nach Geburtsjahren im CSV-Format. Es enthält die Anzahl der Vorkommen (mindestens 5) und Geschlecht. Zum Beispiel enthält die nationale Datei für 2010 33.838 Babynamen.
Sie können die Wikipedia-API ( Ссылка ) ganz einfach verwenden, um die Liste der Seiten in bestimmten Kategorien, Looks, abzurufen wie Kategorie: Vornamen ist etwas, von dem Sie ausgehen möchten.
%Vor%Der Teil des Ergebnisses dieser URL sieht folgendermaßen aus:
%Vor%Sehen Sie sich die API an und wählen Sie geeignete Format- und Abfrageparameter und überprüfen Sie die Kategorien.
P.S. Übrigens: Der Wiki-Text von der Seite, die Sie verlinkt haben, enthält Namen in einer Form, die mit regexp einfach zu extrahieren ist. Neben Titeln von Links in der gerenderten HTML-Seite haben Sie "(name)" angehängt auf den Namen selbst.
Tags und Links dataset