26-09-2017 15:29:32の形式のトランザクションのタイムスタンプを含む変数のデータセットがあります。売上の可能な相関と予測を見つける必要があります(ロジスティック回帰で言えます)。私の質問は:
# Datetime Gender Purchase 1 23/09/2015 00:00:00 0 1 2 23/09/2015 01:00:00 1 0 3 25/09/2015 02:00:00 1 0 4 27/09/2015 03:00:00 1 1 5 28/09/2015 04:00:00 0 0
ランダムな考え:
日付はフィーチャエンジニアリングの優れたソースです。モデルで日付を使用する方法は1つとは思いません。ビジネスユーザーの専門知識は素晴らしいでしょう。データにコード化できる傾向が観察されていますか?
機能の可能な提案は次のとおりです。
これはすべてデータセットに依存し、ほとんどは適用されません。
いくつかのリンク:
http://appliedpredictivemodeling.com/blog/2015/7/28/feature-engineering-versus-feature-extraction
https://www.salford-systems.com/blog/dan-steinberg/using-dates-in-data-mining-models
http://trevorstephens.com/kaggle-titanic-tutorial/r-part-4-feature-engineering/