すべての行で指定された制限内の長さの単一のランダムな単語を含む固定サイズ(1G、10G、100Gなど)のファイルを作成したいと思います。基本的に、これでファイル全体を並べ替えるベンチマークを実行したいと思います。
したがって、1G
のファイルが必要で、単語の長さの制限が4
であるとすると、ファイルのサンプルは次のようになります。
a
bc
def
ghij
ここで、単語の長さは1-4
以内で、4
を超えることはなく、このファイルのサイズは最終的に1G
になります。
[〜#〜] note [〜#〜]:Wordは固定サイズにすることもできます。それは問題にはなりません。
どうすればこれを行うことができますか?
私の質問の理解は、大きなファイルを作成する必要があるということです。このファイルの各行は、指定された長さのランダムな単語です。
Wordが実際のWordである必要はないが、いくつかのランダムな文字である必要がある場合:
< /dev/urandom tr -d -c '[:alpha:]'|head -c 1M|fold -w10 >result.txt
これにより、サイズ1Mのファイルが作成され、各行に10個のランダムな文字が含まれます。