web-dev-qa-db-ja.com

Rの2つのリストをマージする

私は2つのリストを持っています

first = list(a = 1, b = 2, c = 3)
second = list(a = 2, b = 3, c = 4)

これらの2つのリストをマージして、最終製品が

$a
[1] 1 2

$b
[1] 2 3

$c
[1] 3 4

これを行う簡単な関数はありますか?

71
Michael

リストが常に例のように同じ構造を持っている場合、より簡単な解決策は

mapply(c, first, second, SIMPLIFY=FALSE)
99
Andrei

これは、SarkarによるmodifyList関数の非常に単純な適応です。再帰的であるため、mapplyよりも複雑な状況を処理し、 'first'にない 'second'の項目を無視することにより、名前の不一致の状況を処理します。

appendList <- function (x, val) 
{
    stopifnot(is.list(x), is.list(val))
    xnames <- names(x)
    for (v in names(val)) {
        x[[v]] <- if (v %in% xnames && is.list(x[[v]]) && is.list(val[[v]])) 
            appendList(x[[v]], val[[v]])
        else c(x[[v]], val[[v]])
    }
    x
}

> appendList(first,second)
$a
[1] 1 2

$b
[1] 2 3

$c
[1] 3 4
23
42-

次の2つのオプションがあります。最初のオプション:

both <- list(first, second)
n <- unique(unlist(lapply(both, names)))
names(n) <- n
lapply(n, function(ni) unlist(lapply(both, `[[`, ni)))

2つ目は、同じ構造の場合にのみ機能します。

apply(cbind(first, second),1,function(x) unname(unlist(x)))

どちらも望ましい結果をもたらします。

12
Aaron

@Andreiの答えに基づいて、エレガンシー/シンプルさなしで、私が書いたいくつかのコードがあります。利点は、より複雑な再帰的マージが可能であり、rbindで接続する必要がある要素とcで接続している要素間でも異なることです。

# Decided to move this outside the mapply, not sure this is 
# that important for speed but I imagine redefining the function
# might be somewhat time-consuming
mergeLists_internal <- function(o_element, n_element){
  if (is.list(n_element)){
    # Fill in non-existant element with NA elements
    if (length(n_element) != length(o_element)){
      n_unique <- names(n_element)[! names(n_element) %in% names(o_element)]
      if (length(n_unique) > 0){
        for (n in n_unique){
          if (is.matrix(n_element[[n]])){
            o_element[[n]] <- matrix(NA, 
                                     nrow=nrow(n_element[[n]]), 
                                     ncol=ncol(n_element[[n]]))
          }else{
            o_element[[n]] <- rep(NA, 
                                  times=length(n_element[[n]]))
          }
        }
      }

      o_unique <- names(o_element)[! names(o_element) %in% names(n_element)]
      if (length(o_unique) > 0){
        for (n in o_unique){
          if (is.matrix(n_element[[n]])){
            n_element[[n]] <- matrix(NA, 
                                     nrow=nrow(o_element[[n]]), 
                                     ncol=ncol(o_element[[n]]))
          }else{
            n_element[[n]] <- rep(NA, 
                                  times=length(o_element[[n]]))
          }
        }
      }
    }  

    # Now merge the two lists
    return(mergeLists(o_element, 
                      n_element))

  }
  if(length(n_element)>1){
    new_cols <- ifelse(is.matrix(n_element), ncol(n_element), length(n_element))
    old_cols <- ifelse(is.matrix(o_element), ncol(o_element), length(o_element))
    if (new_cols != old_cols)
      stop("Your length doesn't match on the elements,",
           " new element (", new_cols , ") !=",
           " old element (", old_cols , ")")
  }

  return(rbind(o_element, 
               n_element, 
               deparse.level=0))
  return(c(o_element, 
           n_element))
}
mergeLists <- function(old, new){
  if (is.null(old))
    return (new)

  m <- mapply(mergeLists_internal, old, new, SIMPLIFY=FALSE)
  return(m)
}

これが私の例です:

v1 <- list("a"=c(1,2), b="test 1", sublist=list(one=20:21, two=21:22))
v2 <- list("a"=c(3,4), b="test 2", sublist=list(one=10:11, two=11:12, three=1:2))
mergeLists(v1, v2)

この結果:

$a
     [,1] [,2]
[1,]    1    2
[2,]    3    4

$b
[1] "test 1" "test 2"

$sublist
$sublist$one
     [,1] [,2]
[1,]   20   21
[2,]   10   11

$sublist$two
     [,1] [,2]
[1,]   21   22
[2,]   11   12

$sublist$three
     [,1] [,2]
[1,]   NA   NA
[2,]    1    2

ええ、私は知っています-おそらく最も論理的なマージではありませんが、よりカスタマイズされた.combine関数を生成しなければならない複雑な並列ループがあるため、この怪物を書きました:-)

4
Max Gordon

list3 <- append(list1, list2)も機能します

4
JKC

一般的には、

merge_list <- function(...) by(v<-unlist(c(...)),names(v),base::c)

by()ソリューションはattributedリストを返すため、印刷方法は異なりますが、それでもリストになります。ただし、attr(x,"_attribute.name_")<-NULLを使用して属性を削除できます。おそらくaggregate()も使用できます。

1
csta