web-dev-qa-db-ja.com

カット列範囲sed / awk / cat

数千行の長さの*.txtファイルから特定の範囲のテキスト(つまり、文字17〜63)を繰り返し切り取りたいのですが。

1行は次のようになります。

<script>addRow("monatswerte_RR_00002_19140101_20061231_hist.Zip","monatswerte_RR_00002_19140101_20061231_hist.Zip",0,"12.3 kB","8/11/15, 5:18:00 PM");</script>

誰かが方法を提案できますか:

私。このテキスト範囲を切り取りますか?

ii。別の一般的な文字列に追加しますか?

更新:

awk -F\" '{print $2}' all-files.txt > output.txt

.txtという名前のoutput.txtファイルをくれます。それから私は使用しました

awk '{print "ftp://ftp-server.etc..." $0;}' output.txt > list.txt

Webスクレイピングに必要なファイル名の最終リストを生成します。

1
danny_C_O_T_W

私の最初の考えはJeffSchallerの考えと同じでした:cut -c 17-64。ただし、これには終値が含まれるため、cut -c 17-63が必要です。

最初に引用された単語が必要で、すべての単語が同じ長さではない場合は、awkを使用できます:awk -F\" '{print $2}' file.txt

3
glenn jackman