因子レベルの名前を変更するには？

Question

トレーニングセット

trainSample <- cbind(data[1:980,1], data[1:980,2]) cl <- factor(c(data[1:980,3]))

テストセット

testSample <- data(data[981:1485,1], data[981:1485,2]) cl.test <- clknn

予測

k <- knn(trainSample, testSample, cl, k = 5)

出力

< k [1] 2 2 1 1 1 1 2 1 2 1 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 1 2 2 1 1 2 2 2 2 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 [60] 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 1 1 2 1 2 2 1 1 1 2 1 2 2 2 1 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 2 2 [119] 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 1 2 1 1 1 1 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2 2 [178] 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 1 [237] 2 2 2 2 2 1 2 2 1 2 2 1 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1 2 2 1 2 2 2 2 1 2 1 2 2 2 2 1 1 2 1 2 2 2 2 1 2 2 2 [296] 2 2 2 1 2 1 2 1 1 1 2 1 2 2 1 1 2 2 1 2 1 2 2 1 2 2 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 1 2 [355] 1 2 1 2 1 2 1 2 2 2 2 2 2 1 1 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 [414] 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 [473] 2 2 2 2 2 1 1 2 2 2 2 2 1 2 2 1 1 2 2 1 2 2 1 2 1 2 2 1 2 2 2 2 2 Levels: 1 2

私は1と2の代わりに「c」と「not-c」（元のdata.csvのように）が欲しい（どの番号がどの番号を表しているのかわからない）

誰でも助けることができますか？

LyzandeR · Accepted Answer

因子レベルを変更することは非常に簡単であり、どちらが混乱することもありません：

サンプルデータ：

> a <- factor(rep(c(1,2,1),50)) > a [1] 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 [75] 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 [149] 2 1 Levels: 1 2 #this will help later as a verification #this counts the instances for 1 and 2 > table(a) a 1 2 100 50

上記のように、レベルの順序は1最初と2秒。レベルを変更しても（下）、順序は変わりません：

#the assignment function levels can be used to change the levels #the order will remain the same i.e. 'c' for '1' and 'not-c' for '2' levels(a) <- c('c', 'not-c') > a [1] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [25] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [49] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [73] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [97] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [121] c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c c not-c c [145] c not-c c c not-c c Levels: c not-c

そしてこれが検証です：

> table(a) a c not-c 100 50

cbare · Answer

添え字付き割り当ても機能します。たとえば、次の要因があります。

> a <- factor(sample(letters[1:5],100,replace=T)) > a [1] a d d d d a d d a b a b e a c d a c a a b e e d a e d e e a a c a a a b a [38] b b a a e b d b c a a a b e b c e d d b b c c a b a d c b c c d e b d e d [75] a a a b e e c b c b c c d d e e d a e e e b c e b e Levels: a b c d e

それでは、これらのレベルのいくつかに新しい名前を付けましょう。

> levels(a)[c(2,4)] <- c('y','z') > a [1] a z z z z a z z a y a y e a c z a c a a y e e z a e z e e a a c a a a y a [38] y y a a e y z y c a a a y e y c e z z y y c c a y a z c y c c z e y z e z [75] a a a y e e c y c y c c z z e e z a e e e y c e y e Levels: a y c z e

dondapati · Answer

forcatsパッケージを使用します。

a <- factor(rep(c(1,2,1),50)) fct_collapse(a,c = c("1"),`not-c` = c("2"))

Chris · Answer

次のようなことができます：

x<-factor(c(1,1,2,3,1), labels=c("group1","group2","group3")) > x [1] group1 group1 group2 group3 group1 Levels: group1 group2 group3

またはこのように：

train <- read.csv("train.csv", header=TRUE)[1:1000, ] labels <- train[,1]