Как создать компонентные (подмножества) фреймы данных в R на основе значений столбцов?

Я хотел бы разбить фрейм данных на несколько фреймов данных компонентов на основе значений в одном столбце. В моем примере я хочу разделить dat на dat.1, dat.2 и dat.3, используя значения в столбце «cond». Есть ли простая команда, которая могла бы этого добиться?

dat
sub cond    trial   time01  time02
1   1   1   2774    8845
1   1   2   2697    9945
1   2   1   2219    9291
1   2   2   3886    7890
1   3   1   4011    9032
2   2   1   3478    8827
2   2   2   2263    8321
2   3   1   4312    7576
3   1   1   4219    7891
3   3   1   3992    6674


dat.1               
sub cond    trial   time01  time02
1   1   1   2774    8845
1   1   2   2697    9945
3   1   1   4219    7891    

dat.2               
sub cond    trial   time01  time02
2   2   1   3478    8827
2   2   2   2263    8321
1   2   1   2219    9291
1   2   2   3886    7890

dat.3               
sub cond    trial   time01  time02
1   3   1   4011    9032
2   3   1   4312    7576
3   3   1   3992    6674

Возможно, поскольку я новичок в R, я до сих пор не определил, как это сделать, несмотря на то, что просматривал и пробовал решения, предложенные в нескольких похожих запросах на форуме. Заранее благодарим вас за ответы.

dput() данных:

structure(list(sub = c(1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L
), cond = c(1L, 1L, 2L, 2L, 3L, 2L, 2L, 3L, 1L, 3L), trial = c(1L, 
2L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L), time01 = c(2774L, 2697L, 
2219L, 3886L, 4011L, 3478L, 2263L, 4312L, 4219L, 3992L), time02 = c(8845L, 
9945L, 9291L, 7890L, 9032L, 8827L, 8321L, 7576L, 7891L, 6674L
)), .Names = c("sub", "cond", "trial", "time01", "time02"), class = "data.frame", row.names = c(NA, 
-10L))

person dancingRobot    schedule 08.06.2011    source источник


Ответы (4)


Думаю, самый простой способ - через split:

split(dat, dat$cond)

Однако обратите внимание, что это разделение возвращает список data.frames.

Чтобы получить отдельные кадры data.frames из списка, вы можете поступить следующим образом, используя цикл для создания отдельных объектов (неявно в операторе lapply):

tmp <- split(dat, dat$cond)
lapply(1:length(tmp), function(x) assign(paste("dat.", x, sep = ""), tmp[[x]], envir = .GlobalEnv))

Однако использование списка, вероятно, более R и будет более полезным в долгосрочной перспективе.

Спасибо Гэвину за публикацию данных!

person Henrik    schedule 08.06.2011

Есть ли что-нибудь не удовлетворяющее

split(dat, dat$cond)

? У вас есть R и разделение на теги, знаете ли ...

person Nick Sabbe    schedule 08.06.2011

Да, split(). Например, если ваши данные находятся в dat, то:

with(dat, split(dat, cond))

возвращает список, компонентами которого являются нужные вам фреймы данных:

R> with(dat, split(dat, cond))
$`1`
  sub cond trial time01 time02
1   1    1     1   2774   8845
2   1    1     2   2697   9945
9   3    1     1   4219   7891

$`2`
  sub cond trial time01 time02
3   1    2     1   2219   9291
4   1    2     2   3886   7890
6   2    2     1   3478   8827
7   2    2     2   2263   8321

$`3`
   sub cond trial time01 time02
5    1    3     1   4011   9032
8    2    3     1   4312   7576
10   3    3     1   3992   6674
person Gavin Simpson    schedule 08.06.2011
comment
@Same @Nick обыграл нас обоих (я на 12 секунд, если исходные тайминги были правильными) - person Gavin Simpson; 08.06.2011
comment
Спасибо всем, кто ответил. split () решил мою проблему. Я надеюсь, что когда-нибудь смогу помочь в оказании помощи R. - person dancingRobot; 08.06.2011

Для полноты картины вот способ сделать это с помощью пакета plyr.

require(plyr)

> dlply( dat, .(cond))
$`1`
  sub cond trial time01 time02
1   1    1     1   2774   8845
2   1    1     2   2697   9945
9   3    1     1   4219   7891

$`2`
  sub cond trial time01 time02
3   1    2     1   2219   9291
4   1    2     2   3886   7890
6   2    2     1   3478   8827
7   2    2     2   2263   8321

$`3`
   sub cond trial time01 time02
5    1    3     1   4011   9032
8    2    3     1   4312   7576
10   3    3     1   3992   6674

attr(,"class")
[1] "split" "list" 

Обратите внимание на синтаксическую простоту: вы упоминаете dat только один раз.

person Prasad Chalasani    schedule 08.06.2011