コピーアンドペースト後のテキストファイルの列の配置の問題を解決するにはどうすればよいですか？

Question

列7、8、および9をファイル1からファイル2の列7、8、および9にコピーして、新しいファイル3を作成しました。作成されたファイル（ファイル3）は元のファイルとして整列されていません。編集して、アラインメント？

私は次のコマンドを使用しました：

awk '(getline line < "file 1") > -1 {split(line,a); $7 = a[7]; $8 = a[8]; $9= a[9]} 1' file 2 > file 3

ファイル1：

GRM in vacuum 192700 1GRM C1 1 17.188 0.311 13.994 -0.5971 0.0204 -0.0724 1GRM C2 2 0.094 0.383 0.005 0.4831 -0.8709 -0.2204 1GRM C3 3 0.091 0.524 0.008 -0.7098 0.3449 -0.3952

ファイル2：

GRM in vacuum 192760 1GRM C1 1 0.061 0.071 14.000 1GRM C2 2 0.184 0.142 14.000 1GRM C3 3 0.184 0.284 0.000

ファイル3（出力）：

GRM in vacuum 192760 1GRM C1 1 0.061 0.071 14.000 -0.5971 0.0204 -0.0724 1GRM C2 2 0.184 0.142 14.000 0.4831 -0.8709 -0.2204 1GRM C3 3 0.184 0.284 0.000 -0.7098 0.3449 -0.3952

私が使用した位置合わせの問題を解決するために：

 awk 'BEGIN{fmt="%10s%9s%7d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f"} (getline line < "file 1") > -1 {n = split(line,a)} n > 6 {$0 = sprintf(fmt,$1,$2,$3,$4,$5,$6,a[7],a[8],a[9])} 1' "file 2" > file 3

しかし、それでも私には2つの問題があります。

最初の問題は、出力ファイルの列の配置が元のファイル（ファイル1とファイル2）とは異なることです。

2番目の問題は行10002で発生し、列2と3が組み合わされて、行10002から終わりまで出力ファイルの完全な列が消えます。以下は行10002の3つのファイルです。

ファイル1：

2500GRM C3 9999 15.716 8.242 0.002 0.2372 -0.2989 -0.0758 # line 10001 2500GRM C410000 15.592 8.311 0.003 0.2603 -0.2492 -0.2394 # line 10002 2501GRM C110001 15.591 8.453 0.006 0.0887 -0.2458 -0.7014 # line 10003 2501GRM C210002 15.714 8.524 0.007 -0.0788 0.0598 -0.9619 # line 10004

ファイル2：

2500GRM C3 9999 15.433 8.378 0.000 # line 10001 2500GRM C410000 15.310 8.449 0.000 # line 10002 2501GRM C110001 15.310 8.591 0.000 # line 10003 2501GRM C210002 15.433 8.662 0.000 # line 10004

ファイル3：

2500GRM C3 9999 15.433 8.378 0.000 0.2372 -0.2989 -0.0758 # line 10001 2500GRM C410000 15.310 8.449 0.000 -0.2492 -0.2394 # line 10002 2501GRM C110001 15.310 8.591 0.000 -0.2458 -0.7014 # line 10003 2501GRM C210002 15.433 8.662 0.000 0.0598 -0.9619 # line 10004

以下のリンクにあるすべてのファイルを添付しました。

https://drive.google.com/drive/folders/13diMVxlp-T9BXE_jnm_LL1jUPbz8eren

Freddy · Accepted Answer

問題は、_file1_に8または9のデータフィールドがあり、_file2_に5または6のデータフィールドがあることです。 _C3 9999_が1つの不適切な形式のフィールドであるか、_C410000_が2つのフィールド_C4_と_10000_である必要があります。

できるフィールドの数に応じてフォーマットを調整するには

2つのフォーマット文字列を使用して、それらを切り替えます
行を分割して最後の3つの値を取得するときに配列要素の数をn保存します_a[n-2]_、_a[n-1]_、_a[n]_

_awk ' BEGIN{ fmt1="%8s %6s%5s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS fmt2="%8s %11s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS } (getline line < "file 1") > -1{ n=split(line, a) } NF<=3{ print; next } # print original line NF==6{ printf fmt1, $1, $2, $3, $4, $5, $6, a[n-2], a[n-1], a[n]; next } # 6 + 3 fields { printf fmt2, $1, $2, $3, $4, $5, a[n-2], a[n-1], a[n] } # 5 + 3 fields ' "file 2" > "file 3" _

出力：

_ ... 2500GRM C3 9999 15.433 8.378 0.000 0.2372 -0.2989 -0.0758 2500GRM C410000 15.310 8.449 0.000 0.2603 -0.2492 -0.2394 2501GRM C110001 15.310 8.591 0.000 0.0887 -0.2458 -0.7014 2501GRM C210002 15.433 8.662 0.000 -0.0788 0.0598 -0.9619 ... _