web-dev-qa-db-ja.com

awk高精度演算

私はawkに高精度の算術演算を代入演算で行うように指示する方法を探しています。これには、ファイルからフィールドを読み取り、その値を1%の増分で置き換えることが含まれます。しかし、私はそこで精度を失っています。これは問題の単純化された再現です:

 $ echo 0.4970436865354813 | awk '{gsub($1, $1*1.1)}; {print}'
   0.546748

ここでは、小数点以下16桁の精度がありますが、awkでは6桁しかありません。 printfを使用しても、同じ結果が得られます。

$ echo 0.4970436865354813 | awk '{gsub($1, $1*1.1)}; {printf("%.16G\n", $1)}'
0.546748

希望する精度を得る方法について何か提案はありますか?

11
mkc
$ echo 0.4970436865354813 | awk -v CONVFMT=%.17g '{gsub($1, $1*1.1)}; {print}'
0.54674805518902947

むしろここに:

$ echo 0.4970436865354813 | awk '{printf "%.17g\n", $1*1.1}'
0.54674805518902947

おそらくあなたが達成できる最高のものです。代わりにbcを使用して任意の精度にします。

$ echo '0.4970436865354813 * 1.1' | bc -l
.54674805518902943
12

(GNU)awk(bignumがコンパイルされている)でより高い精度を得るには、以下を使用します。

$ echo '0.4970436865354813' | awk -M -v PREC=100 '{printf("%.18f\n", $1)}'
0.497043686535481300

PREC = 100は、デフォルトの53ビットではなく100ビットを意味します。
そのawkが利用できない場合は、bcを使用します

$ echo '0.4970436865354813*1.1' | bc -l
.54674805518902943

または、フロートの本質的な不正確さとともに生きることを学ぶ必要があります。


元の行にはいくつかの問題があります:

  • 1.1の係数は1%ではなく10%の増加です(1.01乗数である必要があります)。 10%使用します。
  • 文字列から(浮動)数値への変換形式は、CONVFMTによって指定されます。デフォルト値は%.6gです。これにより、値が小数点以下6桁に制限されます(ドットの後)。これは、$1のgsub変更の結果に適用されます。

    $ a='0.4970436865354813'
    $ echo "$a" | awk '{printf("%.16f\n", $1*1.1)}'
    0.5467480551890295
    
    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.16f\n", $1)}'
    0.5467480000000000
    
  • Printf形式gは、末尾のゼロを削除します。

    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.16g\n", $1)}'
    0.546748
    
    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.17g\n", $1)}'
    0.54674800000000001
    

    両方の問題は次の方法で解決できます:

    $ echo "$a" | awk '{printf("%.17g\n", $1*1.1)}'
    0.54674805518902947
    

    または

    $ echo "$a" | awk -v CONVFMT=%.30g '{gsub($1, $1*1.1)}; {printf("%.17f\n", $1)}'
    0.54674805518902947 
    

しかし、これがより高い精度を意味するとは考えないでください。内部の数値表現は、依然として倍のサイズの浮動小数点数です。つまり、精度が53ビットであり、17桁まで正確に見える場合でも、正しい10進数は15桁しかありません。それはミラージュです。

$ echo "$a" | awk -v CONVFMT=%.30g '{gsub($1, $1*1.1}; {printf("%.30f\n", $1)}'
0.546748055189029469325134868996

正しい値は次のとおりです。

$ echo "scale=18; 0.4970436865354813 * 1.1" | bc
.54674805518902943

これは、bignumライブラリがコンパイルされている場合、(GNU)awkでも計算できます。

$ echo "$a" | awk -M -v PREC=100 -v CONVFMT=%.30g '{printf("%.30f\n", $1)}'
0.497043686535481300000000000000
2
Isaac