web-dev-qa-db-ja.com

Rの回帰にXGBoostアルゴリズムを使用する方法は?

予測のためにXGBoostテクニックを試していました。私の従属変数は連続的であるため、XGBoostを使用して回帰を行っていましたが、さまざまなポータルで利用可能な参照のほとんどは分類用です。私は使用して知っていますが

objective = "reg:linear"

回帰を行うことはできますが、他のパラメーターについてもある程度明確にする必要があります。誰かがそれのRスニペットを提供してくれれば、とても助かります。

13
Amarjeet
_xgboost(data = X, 
        booster = "gbtree", 
        objective = "binary:logistic", 
        max.depth = 5, 
        eta = 0.5, 
        nthread = 2, 
        nround = 2, 
        min_child_weight = 1, 
        subsample = 0.5, 
        colsample_bytree = 1, 
        num_parallel_tree = 1)
_

これらは、ツリーブースターを使用しているときに使用できるすべてのパラメーターです。線形ブースターでは、次のパラメーターを使用して遊ぶことができます...

_xgboost(data = X, 
        booster = "gblinear", 
        objective = "binary:logistic", 
        max.depth = 5, 
        nround = 2, 
        lambda = 0, 
        lambda_bias = 0, 
        alpha = 0)
_

これらのパラメーターの詳細な意味については、xgboost CRANドキュメントのxg.train()の説明を参照できます。

5
Gaurav

私が見つけたパラメータの最良の説明は

https://github.com/dmlc/xgboost/blob/master/doc/parameter.md

RでXGBoostを使用する例は、Kaggleスクリプトリポジトリから入手できます。例えば:

https://www.kaggle.com/michaelpawlus/springleaf-marketing-response/xgboost-example-0-76178/code

4
Craig