予測のためにXGBoostテクニックを試していました。私の従属変数は連続的であるため、XGBoostを使用して回帰を行っていましたが、さまざまなポータルで利用可能な参照のほとんどは分類用です。私は使用して知っていますが
objective = "reg:linear"
回帰を行うことはできますが、他のパラメーターについてもある程度明確にする必要があります。誰かがそれのRスニペットを提供してくれれば、とても助かります。
_xgboost(data = X,
booster = "gbtree",
objective = "binary:logistic",
max.depth = 5,
eta = 0.5,
nthread = 2,
nround = 2,
min_child_weight = 1,
subsample = 0.5,
colsample_bytree = 1,
num_parallel_tree = 1)
_
これらは、ツリーブースターを使用しているときに使用できるすべてのパラメーターです。線形ブースターでは、次のパラメーターを使用して遊ぶことができます...
_xgboost(data = X,
booster = "gblinear",
objective = "binary:logistic",
max.depth = 5,
nround = 2,
lambda = 0,
lambda_bias = 0,
alpha = 0)
_
これらのパラメーターの詳細な意味については、xgboost CRANドキュメントのxg.train()
の説明を参照できます。
私が見つけたパラメータの最良の説明は
https://github.com/dmlc/xgboost/blob/master/doc/parameter.md
RでXGBoostを使用する例は、Kaggleスクリプトリポジトリから入手できます。例えば:
https://www.kaggle.com/michaelpawlus/springleaf-marketing-response/xgboost-example-0-76178/code