このようなデータフレームがあります:
id adit diag1 diag2
2 3 4230 2234
3 5 3345 4456
4 6 4567 4467
他の2つの列、dse1
およびdse2
以下の擬似コードを使用します。
if diag1 contains 4230 then dse1 = 1 else dse1 = 0
if diag2 contains 4567 then dse2 =1 else dse2 = 0
私はこれを使用しました:
for (i in 1 : nrow(dse)){
for (j in 3: ncol(dse)){
if dse[i,j] %in% ("4320"){dse$dse1 = 1}
else{dse$dse1 = 0}
if dse[i,j] %in% ("4567"){dse$dse2 = 1}
else{dse$dse2 = 0}
}
}
しかし、これらは機能しません。
ループを使用する必要はありません。たとえば、ifelse
を使用します。
dse = within(dse, {
dse1 = ifelse(diag1 == 4230, 1, 0)
dse2 = ifelse(diag2 == 4567, 1, 0)
})
If/elseを使用しないでください。次のようにベクトル化してください:
dat$dse1 <- as.numeric(dat$diag1 == 4230)
dat$dse2 <- as.numeric(dat$diag2 == 4567)
このような:
dse$dse1<-0
dse$dse2<-0
dse$dse1[dse$diag1==4230]<-1
dse$dse2[dse$diag2==4567]<-1
良いRチュートリアル( this など)を入手し、インデックスベクトルについてすべて読んでください。
transform
を使用できます:
transform(dse, dse1 = as.numeric(diag1 == 4230),
dse2 = as.numeric(diag2 == 4567))
以下も使用できます。
ifelse():
dat <- data.frame(id = c(2,3,4), adit = c(3,5,6),diag1 = c(4230,3345,4567), diag2 = c(2234,4567,4467))
dat$dse1 <- ifelse(dat$diag1 == 4230,1,0)
dat$dse2 <- ifelse(dat$diag2 == 4567,1,0)
dat