23の変数を持つ観測値のセットがあります。
Prcompとbiplotを使用して結果をプロットすると、いくつかの問題が発生します。
実際のプロットはフレームの半分(x <0)しか占有しませんが、プロットは0を中心とするため、スペースの半分が無駄になります
2つの変数が結果を明確に支配しているため、他のすべての矢印がまとまり、物事を読み取ることができない
ad 1. xlimやylimを設定しようとしましたが、プロットがすべて混乱しているため、明らかに何かが間違っています。
ad 2.どういうわけか、矢印のラベルをもっと離れて配置して、読み取れるようにできますか?または、2つの最も長い矢印なしで矢印をプロットすることもできます(ズームインのようなもの)?
補遺:バイプロットに矢印とは異なる色でラベルを描画させることは可能ですか?
また、x軸とy軸が比例していない場合、問題がありますか(これらのグラフは、xとyで異なる長さの間隔を示しています)。私はこれが矢印の間に天使をゆがめると思います、そしてそのようなサイズ変更は相似変換ではありません。バイプロットが1:1のアスペクト比を維持するように強制すること、またはプロットを正方形ではなく長方形として描画することは可能ですか?
xlim
とylim
を使用できると思います。また、?biplot
のexpand
引数を確認してください。残念ながら、データを提供しなかったので、サンプルデータをいくつか取りましょう。
a <- princomp(USArrests)
biplot
を呼び出した結果の下:
biplot(a)
そして、xlim
とylim
を使用して "Murder"と "Rape"をさらに詳しく調べ、?biplot
のスケーリング引数expand
を使用することができます。
biplot(a, expand=10, xlim=c(-0.30, 0.0), ylim=c(-0.1, 0.1))
expand
係数により、上軸と右軸のスケーリングが異なることに注意してください。
これはあなたの陰謀を可読にするのに役立ちますか?
[〜#〜]編集[〜#〜]
また、ラベルと矢印の色を変えることができるかどうかも尋ねました。 biplot
はこれをサポートしていません。stats:::biplot.default
のコードをコピーし、必要に応じて変更することができます(col
、plot
、axis
を使用する場合は、text
引数を変更してください)。
または、バイプロットにggplot
を使用することもできます。投稿 here では、単純なバイプロット関数が実装されています。次のようにコードを変更できます。
PCbiplot <- function(PC, x="PC1", y="PC2", colors=c('black', 'black', 'red', 'red')) {
# PC being a prcomp object
data <- data.frame(obsnames=row.names(PC$x), PC$x)
plot <- ggplot(data, aes_string(x=x, y=y)) + geom_text(alpha=.4, size=3, aes(label=obsnames), color=colors[1])
plot <- plot + geom_hline(aes(0), size=.2) + geom_vline(aes(0), size=.2, color=colors[2])
datapc <- data.frame(varnames=rownames(PC$rotation), PC$rotation)
mult <- min(
(max(data[,y]) - min(data[,y])/(max(datapc[,y])-min(datapc[,y]))),
(max(data[,x]) - min(data[,x])/(max(datapc[,x])-min(datapc[,x])))
)
datapc <- transform(datapc,
v1 = .7 * mult * (get(x)),
v2 = .7 * mult * (get(y))
)
plot <- plot + coord_equal() + geom_text(data=datapc, aes(x=v1, y=v2, label=varnames), size = 5, vjust=1, color=colors[3])
plot <- plot + geom_segment(data=datapc, aes(x=0, y=0, xend=v1, yend=v2), arrow=arrow(length=unit(0.2,"cm")), alpha=0.75, color=colors[4])
plot
}
次のようにプロットします。
fit <- prcomp(USArrests, scale=T)
PCbiplot(fit, colors=c("black", "black", "red", "yellow"))
この関数を少し試してみると、xlim
やylim
の値などを設定する方法がわかると思います。