手書き文字認識システムを作成し、英語の文字(数字とアルファベットの両方)でシステムをテストしたいと考えています。数字については、MNISTデータセットでテストを実行しました。ただし、英語のアルファベットについては、公開されている(つまり無料で利用できる)標準データセットを見つけることができませんでした。見つけることができたのは、 [〜#〜] nist [〜#〜] および [〜#〜] cedar [〜#〜] 手書きデータセット、利用可能ですそれぞれの公式サイトにありますが、かなりの費用がかかります。
手書き文字認識システムのテストに使用できる、英語のアルファベットのその他の公開されている標準データセットはありますか。
UCI Machine Learningリポジトリを確認しましたか? http://archive.ics.uci.edu/ml/datasets.html
これはどうですか? http://archive.ics.uci.edu/ml/datasets/UJI+Pen+Characters
これはあなたが探しているものかもしれません: https://www.nist.gov/itl/iad/image-group/emnist-dataset