R - список к фрейму данных

Question

R - список к фрейму данных

431

У меня есть вложенный список данных. Его длина составляет 132, а каждый элемент представляет собой список длиной 20. Существует ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных?

Вот некоторые примеры данных для работы:

l <- replicate(
  132,
  list(sample(letters, 20)),
  simplify = FALSE
)

Btibert3 19 нояб. 2010, в 17:03

Источник

0

Итак, вы хотите, чтобы каждый элемент списка представлял собой строку данных в вашем data.frame?
Joshua Ulrich 19 нояб. 2010, в 16:44
2

@RichieCotton Это не правильный пример. «каждый элемент представляет собой список длиной 20», и вы получили, что каждый элемент представляет собой список из одного элемента вектора длины 20.
Marek 27 июль 2015, в 20:45
0

Опоздал на вечеринку, но я не видел, чтобы кто-то упомянул об этом , что я подумал, было очень удобно (для того, что я хотел сделать).
mfloren 21 март 2017, в 16:51
0

См. Также « Наиболее эффективный список для метода data.frame»?
Henrik 09 июнь 2018, в 20:03
0

упоминается в r-bloggers.com/converting-a-list-to-a-data-frame
千木郷 04 фев. 2019, в 10:36
0

bind_rows (l) - это «эффективная реализация общего шаблона do.call (rbind, dfs)» (простейший ответ, оборачивает ответ Марека)
Arthur Yip 07 март 2019, в 00:02

Показать ещё 4 комментария

Теги:

dataframe

r

list

18 ответов

403

С rbind

do.call(rbind.data.frame, your_list)

Изменить: Предыдущая версия return data.frame of list вместо векторов (как указано в комментариях @IanSudbery).

Marek 19 нояб. 2010, в 17:08

3

Почему это работает, но rbind(your_list) возвращает матрицу списка 1x32?
eykanal 21 дек. 2011, в 17:03
23

@eykanal do.call передает элементы your_list качестве аргументов для rbind . Это эквивалент rbind(your_list[[1]], your_list[[2]], your_list[[3]], ....., your_list[[length of your_list]]) .
Marek 21 дек. 2011, в 22:30
2

Этот метод страдает от нулевой ситуации.
Frank Wang 09 май 2012, в 09:38
3

@FrankWANG Но этот метод не предназначен для нулевой ситуации. Требуется, чтобы your_list содержал векторы одинакового размера. NULL имеет длину 0, поэтому он должен завершиться с ошибкой.
Marek 09 май 2012, в 20:42
12

Кажется, этот метод возвращает правильный объект, но при осмотре объекта вы обнаружите, что столбцы являются списками, а не векторами, что может привести к проблемам в будущем, если вы этого не ожидаете.
Ian Sudbery 15 март 2013, в 10:18
0

@IanSudbery Ты прав. Я отредактирую свой ответ. Не знаю, почему я думал, что он получил список векторов, а не список списков. Хорошо поймал.
Marek 19 март 2013, в 21:29
0

не работает с примерами данных, приведенными в вопросе
MySchizoBuddy 25 июль 2015, в 19:14
0

@MySchizoBuddy Пример, добавленный недавно, не соответствует исходному описанию.
Marek 27 июль 2015, в 20:46
0

Вроде мелкий захват, но это возвращает список, когда он должен возвращать фрейм данных. К счастью, вы можете вызвать as.data.frame () при возврате do.call (), и он будет правильно отформатирован как объект data.frame.
John Haberstroh 22 июль 2017, в 20:41
0

@JohnH. Он должен вернуть data.frame . Не могли бы вы привести пример?
Marek 22 июль 2017, в 21:09
0

Оптимальное решение Marek, особенно потому, что оно принимает имена столбцов и строк (чего нет в решении unlist). Вывод, который я получил, был числовым DF - так что не было вынужденного преобразования коэффициента. Спасибо!
Simone 31 дек. 2017, в 09:55
0

bind_rows - это «эффективная реализация общего шаблона do.call (rbind, dfs)»
Arthur Yip 07 март 2019, в 00:01

Показать ещё 10 комментариев

108

Вы можете использовать пакет plyr. Например, вложенный список формы

l <- list(a = list(var.1 = 1, var.2 = 2, var.3 = 3)
      , b = list(var.1 = 4, var.2 = 5, var.3 = 6)
      , c = list(var.1 = 7, var.2 = 8, var.3 = 9)
      , d = list(var.1 = 10, var.2 = 11, var.3 = 12)
      )

теперь имеет длину 4 и каждый список из l содержит другой список длины 3. Теперь вы можете запустить

  library (plyr)
  df <- ldply (l, data.frame)

и должен получить тот же результат, что и в ответе @Marek и @nico.

mropa 19 нояб. 2010, в 18:46

7

Отличный ответ. Не могли бы вы немного объяснить, как это работает? Он просто возвращает фрейм данных для каждой записи списка?
Michael Barton 16 окт. 2012, в 18:59
11

Имхо ЛУЧШИЙ ответ. Возвращает честный data.frame. Все типы данных (символьные, числовые и т. Д.) Корректно преобразуются. Если список имеет разные типы данных, они будут преобразованы в символьно- matrix .
Roah 24 авг. 2013, в 14:00
1

образец, представленный здесь, не тот, который предоставлен вопросом. результат этого ответа в исходном наборе данных неверен.
MySchizoBuddy 25 июль 2015, в 19:21
0

Прекрасно работает для меня! И имена столбцов в результирующем фрейме данных установлены! Техас
bAN 31 июль 2016, в 11:57

Показать ещё 2 комментария

82

data.frame(t(sapply(mylistlist,c)))

sapply преобразует его в матрицу. data.frame преобразует матрицу в кадр данных.

Alex Brown 19 нояб. 2010, в 17:53

0

обновлен, чтобы принимать внутренние списки в виде строк.
Alex Brown 19 нояб. 2010, в 17:20
14

лучший ответ на сегодняшний день! Ни одно из других решений не дает правильных имен типов / столбцов. БЛАГОДАРЮ ВАС!
d_a_c321 11 янв. 2014, в 02:42
1

Какую роль вы намерены c играть здесь, один экземпляр данных в списке в? Ой, подождите, с для конкатенации, верно? Запутаться с использованием @ mnel c. Я также согласен с @dchandler, поэтому правильное использование имен столбцов было очень важно в моем случае использования. Гениальное решение.
jxramos 23 окт. 2014, в 19:42
0

это право - стандартная функция c; from ?c : Combine Values into a Vector or List
Alex Brown 23 окт. 2014, в 21:35
1

не работает с примерами данных, приведенными в вопросе
MySchizoBuddy 25 июль 2015, в 19:12
0

Кто-то (не создатель) изменил вопрос. Должен быть изменен обратно.
Alex Brown 26 июль 2015, в 14:19
1

Разве это не генерирует data.frame списков?
Carl 26 май 2016, в 21:40
0

@ Карл, почему ты спрашиваешь? Какой результат вы получили?
Alex Brown 26 май 2016, в 22:07
0

Это работает, но df $ id возвращает список вместо фрейма данных.
Florent 08 дек. 2017, в 18:16

Показать ещё 7 комментариев

52

предположим, что ваш список называется L,

data.frame(Reduce(rbind, L))

jdeng 24 март 2014, в 15:57

2

Хороший! Решение @Alex Brown отличается от вашего решения тем, что по вашему маршруту по какой-то причине появилось следующее предупреждающее сообщение: `Предупреждающее сообщение: в data.row.names (row.names, rowi, i): некоторые row.names дублированы : 3,4 -> row.names НЕ используется '
jxramos 23 окт. 2014, в 19:47
0

Отлично!! Работал для меня здесь: stackoverflow.com/questions/32996321/…
Anastasia Pupynina 09 окт. 2015, в 10:36
2

Работает хорошо, если в списке нет только одного элемента: data.frame(Reduce(rbind, list(c('col1','col2')))) создает кадр данных с 2 строками, 1 столбцом (я ожидал 1 строку 2 колонки)
The Red Pea 26 окт. 2015, в 20:17

Показать ещё 1 комментарий

48

В пакете data.table есть функция rbindlist, которая является сверхбыстрой реализацией do.call(rbind, list(...)).

В качестве входа может быть выбран список lists, data.frames или data.tables.

library(data.table)
ll <- list(a = list(var.1 = 1, var.2 = 2, var.3 = 3)
  , b = list(var.1 = 4, var.2 = 5, var.3 = 6)
  , c = list(var.1 = 7, var.2 = 8, var.3 = 9)
  , d = list(var.1 = 10, var.2 = 11, var.3 = 12)
  )

DT <- rbindlist(ll)

Это возвращает a data.table наследует от data.frame.

Если вы действительно хотите преобразовать обратно в файл data.frame, используйте as.data.frame(DT)

mnel 25 март 2013, в 22:32

0

Что касается последней строки, setDF теперь позволяет вернуться к data.frame по ссылке.
Frank 20 апр. 2016, в 20:25
1

Для моего списка с 30 тыс. Элементов rbindlist работал намного быстрее, чем ldply
tallharish 07 июнь 2018, в 21:02

18

Пакет tibble имеет функцию enframe(), которая решает эту проблему, принуждая вложенные объекты list к вложенным объектам tibble ( "tidy" data frame). Вот краткий пример из R для Data Science:

x <- list(
    a = 1:5,
    b = 3:4, 
    c = 5:6
) 

df <- enframe(x)
df
#> # A tibble: 3 × 2
#>    name     value
#>   <chr>    <list>
#>    1     a <int [5]>
#>    2     b <int [2]>
#>    3     c <int [2]>

Поскольку у вас несколько гнезд в вашем списке, l, вы можете использовать unlist(recursive = FALSE), чтобы удалить ненужную вложенность, чтобы получить только один иерархический список, а затем перейти к enframe(). Я использую tidyr::unnest(), чтобы отключить вывод в кадре данных "аккуратный" с одним уровнем, который имеет два столбца (один для группы name и один для наблюдений с группами value). Если вы хотите широко использовать столбцы, вы можете добавить столбец, используя add_column(), который просто повторяет порядок значений 132 раза. Тогда просто spread() значения.

library(tidyverse)

l <- replicate(
    132,
    list(sample(letters, 20)),
    simplify = FALSE
)

l_tib <- l %>% 
    unlist(recursive = FALSE) %>% 
    enframe() %>% 
    unnest()
l_tib
#> # A tibble: 2,640 x 2
#>     name value
#>    <int> <chr>
#> 1      1     d
#> 2      1     z
#> 3      1     l
#> 4      1     b
#> 5      1     i
#> 6      1     j
#> 7      1     g
#> 8      1     w
#> 9      1     r
#> 10     1     p
#> # ... with 2,630 more rows

l_tib_spread <- l_tib %>%
    add_column(index = rep(1:20, 132)) %>%
    spread(key = index, value = value)
l_tib_spread
#> # A tibble: 132 x 21
#>     name   `1`   `2`   `3`   `4`   `5`   `6`   `7`   `8`   `9`  `10`  `11`
#> *  <int> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1      1     d     z     l     b     i     j     g     w     r     p     y
#> 2      2     w     s     h     r     i     k     d     u     a     f     j
#> 3      3     r     v     q     s     m     u     j     p     f     a     i
#> 4      4     o     y     x     n     p     i     f     m     h     l     t
#> 5      5     p     w     v     d     k     a     l     r     j     q     n
#> 6      6     i     k     w     o     c     n     m     b     v     e     q
#> 7      7     c     d     m     i     u     o     e     z     v     g     p
#> 8      8     f     s     e     o     p     n     k     x     c     z     h
#> 9      9     d     g     o     h     x     i     c     y     t     f     j
#> 10    10     y     r     f     k     d     o     b     u     i     x     s
#> # ... with 122 more rows, and 9 more variables: `12` <chr>, `13` <chr>,
#> #   `14` <chr>, `15` <chr>, `16` <chr>, `17` <chr>, `18` <chr>,
#> #   `19` <chr>, `20` <chr>

Matt Dancho 09 апр. 2017, в 11:47

0

Цитируя ОП: «Есть ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных?» Так что, может быть, вам нужен шаг распространения или что-то.
Frank 09 апр. 2017, в 19:37
1

Ах да, просто должен быть столбец индекса, который можно распространять. Я обновлю в ближайшее время.
Matt Dancho 10 апр. 2017, в 20:03

15

Reshape2 дает тот же результат, что и пример plyr выше:

library(reshape2)
l <- list(a = list(var.1 = 1, var.2 = 2, var.3 = 3)
          , b = list(var.1 = 4, var.2 = 5, var.3 = 6)
          , c = list(var.1 = 7, var.2 = 8, var.3 = 9)
          , d = list(var.1 = 10, var.2 = 11, var.3 = 12)
)
l <- melt(l)
dcast(l, L1 ~ L2)

дает:

  L1 var.1 var.2 var.3
1  a     1     2     3
2  b     4     5     6
3  c     7     8     9
4  d    10    11    12

Если вы были почти из пикселей, вы можете сделать это все в 1 строке w/recast().

Jack Ryan 16 май 2013, в 18:33

8

Для общего случая глубоко вложенных списков с 3 или более уровнями, как и те, которые получены из вложенного JSON:

{
"2015": {
  "spain": {"population": 43, "GNP": 9},
  "sweden": {"population": 7, "GNP": 6}},
"2016": {
  "spain": {"population": 45, "GNP": 10},
  "sweden": {"population": 9, "GNP": 8}}
}

рассмотрим подход melt(), чтобы сначала преобразовать вложенный список в высокий формат:

myjson <- jsonlite:fromJSON(file("test.json"))
tall <- reshape2::melt(myjson)[, c("L1", "L2", "L3", "value")]
    L1     L2         L3 value
1 2015  spain population    43
2 2015  spain        GNP     9
3 2015 sweden population     7
4 2015 sweden        GNP     6
5 2016  spain population    45
6 2016  spain        GNP    10
7 2016 sweden population     9
8 2016 sweden        GNP     8

затем dcast(), затем снова разверните в аккуратный набор данных, где каждая переменная формирует столбец, и каждое наблюдение формирует строку:

wide <- reshape2::dcast(tall, L1+L2~L3) 
# left side of the formula defines the rows/observations and the 
# right side defines the variables/measurements
    L1     L2 GNP population
1 2015  spain   9         43
2 2015 sweden   6          7
3 2016  spain  10         45
4 2016 sweden   8          9

ecerulm 06 нояб. 2016, в 13:52

8

Расширение ответа @Marek: если вы хотите избежать превращения строк в факторы и эффективность, это не проблема.

do.call(rbind, lapply(your_list, data.frame, stringsAsFactors=FALSE))

laubbas 28 апр. 2015, в 11:07

0

отлично, у меня тоже сработало :)
Pankaj Kaundal 13 нояб. 2018, в 06:59

8

Дополнительные ответы, а также тайминги в ответе на этот вопрос: Каков наиболее эффективный способ создания списка в виде фрейма данных?

Самый быстрый способ, который не создает блок данных со списками, а не векторами для столбцов (из ответа Мартина Моргана):

l <- list(list(col1="a",col2=1),list(col1="b",col2=2))
f = function(x) function(i) unlist(lapply(x, `[[`, i), use.names=FALSE)
as.data.frame(Map(f(l), names(l[[1]])))

Ian Sudbery 15 март 2013, в 12:49

6

Иногда ваши данные могут быть списком списков векторов одинаковой длины.

lolov = list(list(c(1,2,3),c(4,5,6)), list(c(7,8,9),c(10,11,12),c(13,14,15)) )

(Внутренние векторы также могут быть списками, но я упрощаю это для чтения).

Затем вы можете внести следующие изменения. Помните, что вы можете перечислить один уровень за раз:

lov = unlist(lolov, recursive = FALSE )
> lov
[[1]]
[1] 1 2 3

[[2]]
[1] 4 5 6

[[3]]
[1] 7 8 9

[[4]]
[1] 10 11 12

[[5]]
[1] 13 14 15

Теперь используйте свой любимый метод, упомянутый в других ответах:

library(plyr)
>ldply(lov)
  V1 V2 V3
1  1  2  3
2  4  5  6
3  7  8  9
4 10 11 12
5 13 14 15

user36302 24 окт. 2016, в 22:51

4

Этот метод использует tidyverse пакет (purrr).

Список:

x <- as.list(mtcars)

Преобразование его во фрейм данных (более конкретно, tibble):

library(purrr)
map_df(x, ~.x)

SavedByJESUS 30 май 2018, в 02:27

4

Вот что, наконец, помогло мне:

do.call("rbind", lapply(S1, as.data.frame))

Amit Kohli 11 дек. 2015, в 12:12

3

В зависимости от структуры ваших списков есть несколько опций tidyverse, которые хорошо работают с списками неравной длины:

l <- list(a = list(var.1 = 1, var.2 = 2, var.3 = 3)
        , b = list(var.1 = 4, var.2 = 5)
        , c = list(var.1 = 7, var.3 = 9)
        , d = list(var.1 = 10, var.2 = 11, var.3 = NA))

df <- dplyr::bind_rows(l)
df <- purrr::map_df(l, dplyr::bind_rows)
df <- purrr::map_df(l, ~.x)

# all create the same data frame:
# A tibble: 4 x 3
  var.1 var.2 var.3
  <dbl> <dbl> <dbl>
1     1     2     3
2     4     5    NA
3     7    NA     9
4    10    11    NA

Вы также можете смешивать векторы и фреймы данных:

library(dplyr)
bind_rows(
  list(a = 1, b = 2),
  data_frame(a = 3:4, b = 5:6),
  c(a = 7)
)

# A tibble: 4 x 2
      a     b
  <dbl> <dbl>
1     1     2
2     3     5
3     4     6
4     7    NA

sbha 11 июль 2018, в 03:22

0

Эта функция dplyr :: bind_rows хорошо работает, даже если трудно работать со списками, начинающимися как JSON. От JSON до удивительно чистого кадра данных. Ницца.
GGAnderson 20 март 2019, в 02:15

2

l <- replicate(10,list(sample(letters, 20)))
a <-lapply(l[1:10],data.frame)
do.call("cbind", a)

zhan2383 20 апр. 2016, в 18:12

0

Короткий (но, возможно, не самый быстрый) способ сделать это - использовать базу r, поскольку кадр данных - это просто список векторов равной длины. Таким образом, преобразование между вашим входным списком и data.frame размером 30 x 132 будет следующим: df <- data.frame(l) Оттуда мы можем преобразовать его в матрицу 132 x 30 и преобразовать обратно в dataframe:

new_df <- data.frame(t(df))

Как однострочник: new_df <- data.frame(t(data.frame(l)))

Имена строк будут довольно раздражающими, но вы всегда можете переименовать их с

rownames(new_df) <- 1:nrow(new_df)

Will C 22 дек. 2018, в 01:03

1

Почему это было отвергнуто? Я хотел бы знать, чтобы я не продолжал распространять дезинформацию.
Will C 15 янв. 2019, в 19:19
0

Я определенно делал это раньше, используя комбинацию data.frame и t! Я думаю, что люди, которые проголосовали против, считают, что есть лучшие способы, особенно те, которые не путают имена.
Arthur Yip 07 март 2019, в 00:05
1

Это хороший момент, я думаю, это также неверно, если вы хотите сохранить имена в своем списке.
Will C 12 март 2019, в 21:05

Показать ещё 1 комментарий

-4

test1 < - list (c (a = 'a', b = 'b', c = 'c'), c (a = 'd', b = 'e', c = 'f') ) as.data.frame(test1) a b c 1 a b c 2 d e f

test2 < - list (c ('a', 'b', 'c'), c (a = 'd', b = 'e', c = 'f'))

as.data.frame(test2) a b c 1 a b c 2 d e f

test3 < - list ('Row1' = c (a = 'a', b = 'b', c = 'c'), 'Row2' = c (a = 'd', var2 = 'e ", var3 = 'е'))

as.data.frame(test3) a b c var2 var3 Row1 a b c
Row2 d e f

dileep balineni 29 сен. 2017, в 11:29

Ещё вопросы

Итак, вы хотите, чтобы каждый элемент списка представлял собой строку данных в вашем data.frame?
@RichieCotton Это не правильный пример. «каждый элемент представляет собой список длиной 20», и вы получили, что каждый элемент представляет собой список из одного элемента вектора длины 20.
Опоздал на вечеринку, но я не видел, чтобы кто-то упомянул об этом , что я подумал, было очень удобно (для того, что я хотел сделать).
См. Также « Наиболее эффективный список для метода data.frame»?
упоминается в r-bloggers.com/converting-a-list-to-a-data-frame
bind_rows (l) - это «эффективная реализация общего шаблона do.call (rbind, dfs)» (простейший ответ, оборачивает ответ Марека)
Почему это работает, но rbind(your_list) возвращает матрицу списка 1x32?
@eykanal do.call передает элементы your_list качестве аргументов для rbind . Это эквивалент rbind(your_list[[1]], your_list[[2]], your_list[[3]], ....., your_list[[length of your_list]]) .
Этот метод страдает от нулевой ситуации.
@FrankWANG Но этот метод не предназначен для нулевой ситуации. Требуется, чтобы your_list содержал векторы одинакового размера. NULL имеет длину 0, поэтому он должен завершиться с ошибкой.
Кажется, этот метод возвращает правильный объект, но при осмотре объекта вы обнаружите, что столбцы являются списками, а не векторами, что может привести к проблемам в будущем, если вы этого не ожидаете.
@IanSudbery Ты прав. Я отредактирую свой ответ. Не знаю, почему я думал, что он получил список векторов, а не список списков. Хорошо поймал.
не работает с примерами данных, приведенными в вопросе
@MySchizoBuddy Пример, добавленный недавно, не соответствует исходному описанию.
Вроде мелкий захват, но это возвращает список, когда он должен возвращать фрейм данных. К счастью, вы можете вызвать as.data.frame () при возврате do.call (), и он будет правильно отформатирован как объект data.frame.
@JohnH. Он должен вернуть data.frame . Не могли бы вы привести пример?
Оптимальное решение Marek, особенно потому, что оно принимает имена столбцов и строк (чего нет в решении unlist). Вывод, который я получил, был числовым DF - так что не было вынужденного преобразования коэффициента. Спасибо!
bind_rows - это «эффективная реализация общего шаблона do.call (rbind, dfs)»
Отличный ответ. Не могли бы вы немного объяснить, как это работает? Он просто возвращает фрейм данных для каждой записи списка?
Имхо ЛУЧШИЙ ответ. Возвращает честный data.frame. Все типы данных (символьные, числовые и т. Д.) Корректно преобразуются. Если список имеет разные типы данных, они будут преобразованы в символьно- matrix .
образец, представленный здесь, не тот, который предоставлен вопросом. результат этого ответа в исходном наборе данных неверен.
Прекрасно работает для меня! И имена столбцов в результирующем фрейме данных установлены! Техас
обновлен, чтобы принимать внутренние списки в виде строк.
лучший ответ на сегодняшний день! Ни одно из других решений не дает правильных имен типов / столбцов. БЛАГОДАРЮ ВАС!
Какую роль вы намерены c играть здесь, один экземпляр данных в списке в? Ой, подождите, с для конкатенации, верно? Запутаться с использованием @ mnel c. Я также согласен с @dchandler, поэтому правильное использование имен столбцов было очень важно в моем случае использования. Гениальное решение.
это право - стандартная функция c; from ?c : Combine Values into a Vector or List
не работает с примерами данных, приведенными в вопросе
Кто-то (не создатель) изменил вопрос. Должен быть изменен обратно.
Разве это не генерирует data.frame списков?
@ Карл, почему ты спрашиваешь? Какой результат вы получили?
Это работает, но df $ id возвращает список вместо фрейма данных.
Хороший! Решение @Alex Brown отличается от вашего решения тем, что по вашему маршруту по какой-то причине появилось следующее предупреждающее сообщение: `Предупреждающее сообщение: в data.row.names (row.names, rowi, i): некоторые row.names дублированы : 3,4 -> row.names НЕ используется '
Отлично!! Работал для меня здесь: stackoverflow.com/questions/32996321/…
Работает хорошо, если в списке нет только одного элемента: data.frame(Reduce(rbind, list(c('col1','col2')))) создает кадр данных с 2 строками, 1 столбцом (я ожидал 1 строку 2 колонки)
Что касается последней строки, setDF теперь позволяет вернуться к data.frame по ссылке.
Для моего списка с 30 тыс. Элементов rbindlist работал намного быстрее, чем ldply
Цитируя ОП: «Есть ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных?» Так что, может быть, вам нужен шаг распространения или что-то.
Ах да, просто должен быть столбец индекса, который можно распространять. Я обновлю в ближайшее время.
Эта функция dplyr :: bind_rows хорошо работает, даже если трудно работать со списками, начинающимися как JSON. От JSON до удивительно чистого кадра данных. Ницца.
Почему это было отвергнуто? Я хотел бы знать, чтобы я не продолжал распространять дезинформацию.
Я определенно делал это раньше, используя комбинацию data.frame и t! Я думаю, что люди, которые проголосовали против, считают, что есть лучшие способы, особенно те, которые не путают имена.
Это хороший момент, я думаю, это также неверно, если вы хотите сохранить имена в своем списке.

nico · Accepted Answer · 2010-11-19T18-17-00.000Z

289

Лучший ответ

Предполагая, что ваш список списков называется l:

df <- data.frame(matrix(unlist(l), nrow=132, byrow=T))

Вышеупомянутое преобразует все столбцы символов в факторы, чтобы избежать этого, вы можете добавить параметр к вызову data.frame():

df <- data.frame(matrix(unlist(l), nrow=132, byrow=T),stringsAsFactors=FALSE)

nico 19 нояб. 2010, в 18:17

0

@ Джошуа Ульрих: Упс! Я не знаю почему, но я думал, что он просит матрицу :)
nico 19 нояб. 2010, в 18:27
7

unlist сделал свое дело. После этого я мог манипулировать / менять то, что мне было нужно. Спасибо!
Btibert3 19 нояб. 2010, в 21:30
84

Осторожно, если ваши данные не все одного типа. Прохождение через матрицу означает, что все данные будут приведены к общему типу. Т.е., если у вас есть один столбец символьных данных и один столбец числовых данных, числовые данные будут приводиться к строке по матрице (), а затем к факторизации с помощью data.frame ().
Ian Sudbery 15 март 2013, в 10:15
0

Каков наилучший способ сделать это, если в списке отсутствуют значения или включить NA в кадр данных?
Dave 25 нояб. 2013, в 18:29
0

@ Дэйв: Я не думаю, что следую за тобой ... это работает, даже если вокруг есть АН ...
nico 25 нояб. 2013, в 19:53
0

@nico для меня, если бы был рваный фрейм данных, он не будет включать NA
Dave 27 нояб. 2013, в 17:58
1

@Dave: работает для меня ... см. Здесь r-fiddle.org/#/fiddle?id=y8DW7lqL&version=3
nico 27 нояб. 2013, в 18:47
0

@nico должно быть, потому что у меня нет матрицы, это фрейм данных
Dave 27 нояб. 2013, в 20:01
0

@Dave: обратите внимание, что я выводю фрейм данных, а не матрицу. Я прохожу через матрицу только для разделения данных на столбцы. В любом случае, может быть, лучше опубликовать новый вопрос с более подробной информацией и воспроизводимым примером. :)
nico 28 нояб. 2013, в 07:11
4

Также будьте осторожны, если у вас есть символьный тип данных - data.frame преобразует его в факторы.
Alex Brown 16 май 2014, в 18:12
0

Ответ @ mropa намного лучше, так как он проще и сохраняет типы данных.
SigmaX 07 июнь 2015, в 17:32
0

Ответ @mropas не работает с образцом в вопросе. Он работает с собственными образцами данных. Из всех ответов только этот дает правильный результат.
MySchizoBuddy 25 июль 2015, в 19:16
0

@VickyZhang хорошо, я не слишком хорошо разбираюсь в Python, чтобы быть честным (я не знал, например, что у него вообще был фрейм данных ...). В любом случае вы, вероятно, можете перечислить ряд других вещей, которые в Python длиннее, чем в R, но это практически ничего не значит. Это разные языки, созданные для разных целей. И, прежде всего, это однострочник, мне это не кажется сложным.
nico 16 авг. 2015, в 16:44
3

@nico Есть ли способ сохранить имена элементов списка в качестве имен столбцов или строк в df?
N.Varela 18 дек. 2015, в 21:47
0

Чтобы сделать его более динамичным, вы могли бы написать nrow = length(l) вместо nrow = 132 .
ha_pu 01 март 2019, в 17:42
0

@ha_pu хороший момент - будет редактировать
nico 02 март 2019, в 12:18

Показать ещё 14 комментариев