16列のデータフレーム内の各数値を、各列の特定の数値で除算しようとしています。数値は、1〜16のデータフレームとして格納されます。1〜16の列は、大きなデータフレームの列のサンプルに対応しています。列ごとに1つの数値があり、大きなスプレッドシートの各数値で除算して、出力を最終的なスプレッドシートに出力する必要があります。
これが私が始めていることの例です。分割するスプレッドシート。
X131.478.1 X131.478.2 X131.NSC.1 X131.NSC.2 X166.478.1 X166.478.2
1/2-SBSRNA4 4 2 2 6 7 6
A1BG 93 73 88 86 58 65
A1BG-AS1 123 103 96 128 46 57
スプレッドシートを分割する数値
X131.478.1 1.0660880
X131.478.2 0.9104053
X131.NSC.1 0.8642545
X131.NSC.2 0.9611866
X166.478.1 0.9711406
X166.478.2 1.0560121
予想される結果は、ここで行ったように必ずしも丸められていません。
X131.478.1 X131.478.2 X131.NSC.1 X131.NSC.2 X166.478.1 X166.478.2
1/2-SBSRNA4 3.75 2.19 2.31 6.24 7.20 5.68
A1BG 87.23 80.17 101.82 89.47 59.72 61.55
A1BG-AS1 115.37 113.13 111.07 133.16 47.36 53.97
データフレームmx2 = mx/sfを単純に分割してみました。mxは大きなデータセットで、sfは除算する数値のデータフレームです。それはすべてをsfデータセットの最初の数で割るように見えました。
除算の数値は、DESeqパッケージの一部である推定サイズファクターによって生成された場合に役立ちます。
どんな助けでも素晴らしいでしょう。ありがとう!
sweep
は、この種の操作に役立ちますが、入力として行列が必要です。そのため、データフレームを行列に変換し、操作を実行してから元に戻します。たとえば、行列mat
の各列の各要素をベクトルvec
の対応する値で除算するダミーデータ:
_mat <- matrix(1:25, ncol = 5)
vec <- seq(2, by = 2, length = 5)
sweep(mat, 2, vec, `/`)
_
使用中:
_> mat
[,1] [,2] [,3] [,4] [,5]
[1,] 1 6 11 16 21
[2,] 2 7 12 17 22
[3,] 3 8 13 18 23
[4,] 4 9 14 19 24
[5,] 5 10 15 20 25
> vec
[1] 2 4 6 8 10
> sweep(mat, 2, vec, `/`)
[,1] [,2] [,3] [,4] [,5]
[1,] 0.5 1.50 1.833333 2.000 2.1
[2,] 1.0 1.75 2.000000 2.125 2.2
[3,] 1.5 2.00 2.166667 2.250 2.3
[4,] 2.0 2.25 2.333333 2.375 2.4
[5,] 2.5 2.50 2.500000 2.500 2.5
> mat[,1] / vec[1]
[1] 0.5 1.0 1.5 2.0 2.5
_
データフレームから変換するには、as.matrix(df)
またはdata.matrix(df)
を使用し、逆の場合はas.data.frame(mat)
を使用します。
データフレームdf
があるとします。
> df
a b c
1 1 3 100
2 2 4 110
そして、各行を同じベクトルvec
で除算します。
> vec <- df[1,]
> vec
a b c
1 1 3 100
次に、mapply
を次のように使用できます。
> mapply('/', df, vec)
a b c
[1,] 1 1.000000 1.0
[2,] 2 1.333333 1.1
多様性のために、mapply
を使用することもできます
mx <- structure(list(X131.478.1 = c(4L, 93L, 123L), X131.478.2 = c(2L,
73L, 103L), X131.NSC.1 = c(2L, 88L, 96L), X131.NSC.2 = c(6L,
86L, 128L), X166.478.1 = c(7L, 58L, 46L), X166.478.2 = c(6L,
65L, 57L)), .Names = c("X131.478.1", "X131.478.2", "X131.NSC.1",
"X131.NSC.2", "X166.478.1", "X166.478.2"), class = "data.frame", row.names = c("1/2-SBSRNA4",
"A1BG", "A1BG-AS1"))
sf <- structure(list(V1 = c(1.066088, 0.9104053, 0.8642545, 0.9611866,
0.9711406, 1.0560121)), .Names = "V1", row.names = c("X131.478.1",
"X131.478.2", "X131.NSC.1", "X131.NSC.2", "X166.478.1", "X166.478.2"
), class = "data.frame")
mapply(function(x, y) x * y, mx, t(sf))
X131.478.1 X131.478.2 X131.NSC.1 X131.NSC.2 X166.478.1 X166.478.2
[1,] 4.264352 1.820811 1.728509 5.76712 6.797984 6.336073
[2,] 99.146184 66.459587 76.054396 82.66205 56.326155 68.640787
[3,] 131.128824 93.771746 82.968432 123.03188 44.672468 60.192690
しかし、これについてはジョシュの答えの方が良いと思います...そしてギャビンの答えはさらに良いです!
これは要素ごとの行列乗算に他なりません。
mat <- matrix(c(4,2,2,6,7,6, 93,73,88,86,58,65, 123,103,96,128,46,57), nrow=3, byrow=T)
vec = c(1.0660880,0.9104053,0.8642545,0.9611866,0.9711406,1.0560121)
mat %o% 1/vec
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 3.752035 2.080761 1.876018 6.242284 6.566062 6.242284
[2,] 102.152305 75.169342 96.660246 88.555663 63.707889 66.931606
[3,] 142.319190 97.536761 111.078392 121.210732 53.225063 53.976654
これを行うには、 outer-productアプローチ を使用しました。これは、mat %*% 1/vec
を直接試行すると、non-conformable arguments
で形状が異なるためにエラーが発生するためです。または https://stackoverflow.com/search?q=%5Br%5D+multiply+matrix+by+vector の多くの投稿をご覧ください
transform
を使用できます
mx2 <- transform(mx,
X131.478.1=X131.478.1/sf["X131.478.1",1],
X131.478.2=X131.478.2/sf["X131.478.2",1],
etc
)
16列で入力するのはかなり少しですが、機能するはずです。