いくつかの小さなリスト/名前のセットに出くわしましたが、名前のリストを提供できる無料のデータソースがそこにあるかどうか疑問に思っていました(カンマ区切りまたはSQL構造)。
次の2つのサイトを見つけました。
http://names.mongabay.com/most_common_surnames.htm
http://baby-names.familyeducation.com/browse/letter/a?detoured=1
ただし、包括的なファイルをダウンロードするのではなく、名前を参照することしかできないようです。
米国国勢調査局はこの情報を提供していませんか?
私は、さまざまな国や文化、その中の英国の姓を含むデータベースを作成しています。 プロジェクトとそのデータセットはここにあります: https://github.com/enorvelle/NameDatabases(デッド:リンク、プロジェクト、GitHubアカウント)
これは github.com/smashew/NameDatabases .に移行したようです(唯一の寄稿者「Erik Norvelle」。)
私がこれで見つけることができた最高の情報源は、社会保障局によって提供されたデータです-国勢調査のデータとは異なり、彼らは毎年1900年まで遡る最初の名前を持っています。
国勢調査局は2000年と1990年の国勢調査からの一般的な姓のリストを提供します: http://www.census.gov/topics/population/genealogy/data/2000_surnames.htmlhttp:/ /www.census.gov/topics/population/genealogy/data/1990_census/1990_census_namefiles.html
1990年の国勢調査ファイルには、一般的な男性と女性の名前のリストも含まれています。
オプション1)何百万もの人々のデータをgithubにアップロードし、別のWebサイトからクロールし、Googleオープンデータセットからダンプしました。
https://github.com/aakashkag/People-Name-List [姓名ディレクトリのGithubリンク]
オプション2)
Google BigQuery公開データセット: https://cloud.google.com/bigquery/public-data/
Googleオープンデータセットから名前と性別を取得できます。
1)データセット:bigquery-public-data:github_repos
例: https://app.hyfy.io/v/abRJ75Xizno/
クエリ:SELECT * FROM fh-bigquery.popular_names.usa_summary_1880_2015
LIMIT 1000利用可能な名前の合計:1858689
2)日付セット:bigquery-public-data.github_repos.commits
クエリ:SELECT author.name as author_name、author.email as author_email、committer.name as committer_name、committer.email as committer_email、repo_name FROM bigquery-public-data.github_repos.commits
3)日付セット:bigquery-public-data.usa_names.usa_1910_2013`
クエリ:SELECT * FROM bigquery-public-data.usa_names.usa_1910_2013
または、Linkdinから取得できます https://www.linkedin.com/directory/people-a