web-dev-qa-db-ja.com

Excelの近似曲線の精度

これは私が時々抱える問題であり、私が得るすべてのトレンドラインを常に再チェックしなければならないので、それは私を非常に苛立たせます。

例:

r       L
(mm)    
30,00   97,0  
60,00   103,2  
90,00   106,0  
110,00  101,0  
125,00  88,0  
140,00  62,0  
148,00  36,7  
152,50  17,0   

X軸にr[〜#を使用してトレンドラインを(3次多項式回帰タイプを使用して)描画すると〜] l [〜#〜]yの場合、Excelは式を与えます

y =-0,0002x³+0,0341x²-1,8979x+ 128,73

r²= 0,994の場合。その式を使用して、式の派生元と同じrの値を補間すると、次のようになります。

r   y  
(mm)      
30,00   97,083  
60,00   94,416  
90,00   88,329  
110,00  66,371  
125,00  33,68  
140,00  -17,416  
148,00  -53,5912  
152,50  -76,97725  

まったく違うの?

なぜこれが起こるのですか?その理由は何ですか?

4
Rook

Excelが与えた式は丸められた係数を持っているように見えます。回帰にOpenOfficecalcルーチンを使用すると、次の式が得られます。これは、データによりよく適合しています。

y=-0.00017257x³+0.034107417x²-1.89794239x+128.7325785

X³項が非常に大きいため、係数のわずかな違いが予測結果に大きな影響を与えます。

3
W_Whalley

W_Whalley で説明したように、これはExcelが数式で表示された値を丸めているためです。ラベルの書式設定、およびその方法は次のとおりです。

  1. グラフを作成し、近似曲線を追加して、数式ラベルを表示します。

  2. 数式ラベルを右クリックして、データラベルのフォーマット...を選択します

  3. Numberタブで、タイプNumberを選択し、必要な小数点以下の桁数を入力します。

  4. フォーマットウィンドウを閉じます。

これは、与えられたサンプルデータの小数点以下の桁数を20に設定した結果です。スクロールバーを避けるために改行が追加されています。

y = -0.00017256831201215700x³ + 0.03410741673273060000x²
                  - 1.89794238802443000000x + 128.73257845634200000000
7
DMA57361

自分で回帰係数を導出できない場合は、r値を10で割ったr値に置き換えるだけです。つまり、30は3になり、60は6になります。 Excelは有効数字を使用するため、係数をより正確に再計算することがわかります。

1
Toc