私は2つのデータフレームを持っています:
dat:9変数の1900 obs
V1 V2 V3 V4 V5 V6 V7 V8 V9
1 V_P50P50_Q3 chr12 106642383 106642395 + 18.1425 4.03e-08 0.0515 GGGGGACTCCCCC
2 V_P50RELAP65_Q5_01 chr8 142276666 142276677 - 16.6429 2.51e-07 0.2780 GGGATTTCCCAC
3 V_RELA_Q6 chr22 51020067 51020078 - 15.9395 2.71e-07 0.3350 GGGAATTTCCCC
4 V_NFKB_Q6_01 chr14 98601454 98601469 + 17.0684 3.08e-07 0.236 GGAGTGGAAATTCC
5 V_CREL_Q6 chr22 51020068 51020079 - 16.1165 3.19e-07 0.4050 AGGGAATTTCCC
dat.markov:9変数の1486 obs
V1 V2 V3 V4 V5 V6 V7 V8 V9
1 V_NFKB_Q6_01 chr14 98601454 98601469 + 17.2212 1.33e-07 0.146 GGAGTGGAAATTCCCT
2 V_P50P50_Q3 chr12 106642383 106642395 + 16.9358 1.57e-07 0.201 GGGGGACTCCCCC
3 V_CREL_Q6 chr22 51020068 51020079 - 16.0549 2.29e-07 0.292 AGGGAATTTCCC
4 V_NFKB_Q6_01 chr22 51020064 51020079 + 16.9906 2.32e-07 0.146 TTGGGGGAAATTCCCT
5 V_RELA_Q6 chr22 51020067 51020078 - 15.7496 3.42e-07 0.433 GGGAATTTCCCC
2つのdata.frame間で一致する列V1、V2、V3、およびV4を持つすべての行を取得するように、2つのデータフレームをマージする必要があります。
私は試した:
y<-merge(dat,dat.markov,by=c("V1","V2","V3","V4"))
これにより、マージされたデータフレームが得られますが、1513obsがあります。ただし、技術的には、観測値の数は、小さいデータフレーム(1486 obs)以下である必要があります。
マージされたdata.frameは、返される列の数に関しては問題ないように見えます。
V1 V2 V3 V4 V5.x V6.x V7.x V8.x V9.x V5.y
1 V_CREL_01 chr10 112778464 112778473 + 12.9434 1.94e-05 0.694 TGGGTTTTCC +
V6.y V7.y V8.y V9.y
1 12.8838 2.35e-05 0.788 TGGGTTTTCC
1つの列を使用してdata.framesを交差させることができることは知っていますが、複数の列で2つのdata.framesを交差させる方法はありますか?
私が理解している場合、列1、2、3、4を両方のフレームで完全に一致させて、それらを維持する必要がありますか? merge
の他に、interaction
関数とmatch
関数を使用します
dat$combine = as.character(interaction(dat$V1, dat$V2, dat$V3, dat$V4))
dat.markov$combine = as.character(interaction(dat.markov$V1, dat.markov$V2, dat.markov$V3, dat.markov$V4))
dat.overlap = dat[complete.cases(match(dat.markov$combine, dat$combine)),]