数千行の長さの*.txt
ファイルから特定の範囲のテキスト(つまり、文字17〜63)を繰り返し切り取りたいのですが。
1行は次のようになります。
<script>addRow("monatswerte_RR_00002_19140101_20061231_hist.Zip","monatswerte_RR_00002_19140101_20061231_hist.Zip",0,"12.3 kB","8/11/15, 5:18:00 PM");</script>
誰かが方法を提案できますか:
私。このテキスト範囲を切り取りますか?
ii。別の一般的な文字列に追加しますか?
更新:
awk -F\" '{print $2}' all-files.txt > output.txt
.txt
という名前のoutput.txt
ファイルをくれます。それから私は使用しました
awk '{print "ftp://ftp-server.etc..." $0;}' output.txt > list.txt
Webスクレイピングに必要なファイル名の最終リストを生成します。
私の最初の考えはJeffSchallerの考えと同じでした:cut -c 17-64
。ただし、これには終値が含まれるため、cut -c 17-63
が必要です。
最初に引用された単語が必要で、すべての単語が同じ長さではない場合は、awkを使用できます:awk -F\" '{print $2}' file.txt