web-dev-qa-db-ja.com

パンダのOLSサマリーから特定の値を抽出する方法は?

パンダの線形回帰の要約から他の値を取得することは可能ですか(現在、ベータとインターセプトを取得する方法しか知りません)?決定係数を取得する必要があります。マニュアルからの抜粋は次のとおりです。

In [244]: model = ols(y=rets['AAPL'], x=rets.ix[:, ['GOOG']])

In [245]: model
Out[245]: 
-------------------------Summary of Regression Analysis---------------------   ----
Formula: Y ~ <GOOG> + <intercept>
Number of Observations:         756
Number of Degrees of Freedom:   2
R-squared:         0.2814
Adj R-squared:     0.2805
Rmse:              0.0147
F-stat (1, 754):   295.2873, p-value:     0.0000
Degrees of Freedom: model 1, resid 754
-----------------------Summary of Estimated Coefficients------------------------
      Variable       Coef    Std Err     t-stat    p-value    CI 2.5%   CI 97.5%
--------------------------------------------------------------------------------
      GOOG     0.5442     0.0317      17.18     0.0000     0.4822     0.6063
 intercept     0.0011     0.0005       2.14     0.0327     0.0001     0.0022
---------------------------------End of Summary---------------------------------

ありがとう

8
Joe

試してください:

print model.r2

例えば:

import pandas as pd
from pandas import Panel
from pandas.io.data import DataReader
import scikits.statsmodels.api as sm

symbols = ['MSFT', 'GOOG', 'AAPL']

data = dict((sym, DataReader(sym, "yahoo")) for sym in symbols)

panel = Panel(data).swapaxes('items', 'minor')

close_px = panel['Close']

# convert closing prices to returns
rets = close_px / close_px.shift(1) - 1
model = pd.ols(y=rets['AAPL'], x=rets.ix[:, ['GOOG']])
print model.r2

ドキュメント: http://statsmodels.sourceforge.net/stable/index.html

1
hhbilly

回帰の結果を処理するドキュメント -これにより、回帰結果からいくつかの値を抽出できます。

# Given
model = ols(y=rets['AAPL'], x=rets.ix[:, ['GOOG']])

r-squaredを使用する場合:

# retrieving model's r-squared value
model.rsquared

p-valuesの場合:

# return p-values and corresponding coefficients in model
model.pvalues

その他のパラメーター(fvaluesess)については、 doc を参照してください。

13
foxyblue