Изменение имен столбцов фрейма данных

Question

Изменение имен столбцов фрейма данных

315

У меня есть кадр данных, называемый "newprice" (см. ниже), и я хочу изменить имена столбцов в моей программе в R.

> newprice
   Chang.  Chang.   Chang.
1     100       36      136
2     120      -33       87
3     150       14      164

На самом деле это то, что я делаю:

names(newprice)[1]<-paste("premium")
names(newprice)[2]<-paste("change")
names(newprice)[3]<-paste("newprice")

Я не помещал это в цикл, потому что я хочу, чтобы каждое имя столбца было другим, как вы видите.

Когда я вставляю свою программу в консоль R, это результат, который он мне дает:

> names(newprice)[1]<-paste("premium")
Error: unexpected input in "names(newprice)[1]<-paste(""
> names(newprice)[2]<-paste("change")
Error: unexpected input in "names(newprice)[2]<-paste(""
> names(newprice)[3]<-paste("newpremium")
Error: unexpected input in "names(newprice)[3]<-paste(""

Я также попытался использовать функцию c(), например c("premium"), вместо функции paste(), но безрезультатно.

Может ли кто-нибудь помочь мне разобраться с этим?

Son 21 май 2011, в 11:21

Источник

0

Если ответ Дирка сработал, то проблема заключалась в том, что вы работали с матрицей, а не с фреймом данных. Вы можете проверить это с помощью is.matrix или str .
42- 21 май 2011, в 12:17
3

Смотрите этот ответ на dplyr :: переименовать stackoverflow.com/a/26146202/1831980
Rasmus Larsen 08 фев. 2016, в 11:53
2

colnames(newprice)<- c("premium","change","newprice")
Tung Nguyen 20 июль 2016, в 07:00

Показать ещё 1 комментарий

Теги:

dataframe

r

17 ответов

Ещё вопросы

Если ответ Дирка сработал, то проблема заключалась в том, что вы работали с матрицей, а не с фреймом данных. Вы можете проверить это с помощью is.matrix или str .
Смотрите этот ответ на dplyr :: переименовать stackoverflow.com/a/26146202/1831980

Dirk Eddelbuettel · Answer 1 · 2011-05-21T12-49-00.000Z

Используйте функцию colnames():

R> X <- data.frame(bad=1:3, worse=rnorm(3))
R> X
  bad     worse
1   1 -2.440467
2   2  1.320113
3   3 -0.306639
R> colnames(X) <- c("good", "better")
R> X
  good    better
1    1 -2.440467
2    2  1.320113
3    3 -0.306639

Вы также можете подмножить:

R> colnames(X)[2] <- "superduper"

@Dirk Почему бы не использовать names () вместо colnames ()?
Большой! Вы также можете использовать несколько столбцов одновременно (полезно для больших фреймов данных). colnames(X)[c(1,2)] <- c("good", "better")
Попробуйте setnames() в пакете data.table . Используйте что-то вроде setnames(DT,"b","B") или setnames(DT,c("a","E"),c("A","F"))
Как ни странно, после установки имен столбцов фрейма данных q1 , попытка dplyr фрейм данных с помощью dplyr как в q1 <- q1 %>% mutate(rel_count = count / 482462) приводит к ошибке Error in mutate_impl(.data, dots) : unknown column 'days' (где days - это новое имя, данное столбцу). Это действительно расстраивает.

Matheus Abreu · Answer 2 · 2014-03-17T19-51-00.000Z

126

Я использую это:

colnames(dataframe)[which(names(dataframe) == "columnName")] <- "newColumnName"

Matheus Abreu 17 март 2014, в 19:51

5

Спасибо. Я думаю, что это как-то раздражает с R: Почему так трудно изменить имя столбца, если вы не хотите использовать индексный номер, но старое имя :(
Arne 18 март 2014, в 14:41
20

вам не нужно, which в этой команде
thias 06 нояб. 2014, в 11:38
7

Преимущество этого метода заключается в том, что вам не нужно беспокоиться о положении столбца, если вы знаете его оригинальное имя. Я думаю, что это предпочтительный метод, так как вы можете - позже - внести изменения в код, который изменяет положение столбца, который вы хотите переименовать.
Paulo S. Abreu 21 дек. 2015, в 19:00

Показать ещё 1 комментарий

Joshua Ulrich · Answer 3 · 2011-05-21T14-18-00.000Z

Ошибка вызвана "умными кавычками" (или тем, что они вызывают). Урок здесь: "Не записывайте свой код в" редактор ", который преобразует цитаты в смарт-кавычки".

names(newprice)[1]<-paste("premium")  # error
names(newprice)[1]<-paste("premium")  # works

Кроме того, вам не нужен paste("premium") (вызов paste является избыточным), и рекомендуется помещать пробелы вокруг <-, чтобы избежать путаницы (например, x <- -10; if(x<-3) "hi" else "bye"; x).

Здравствуйте, Джошуа, вы комментируете «умные цитаты» очень верно. большое спасибо.

Jamie · Answer 4 · 2011-05-21T13-34-00.000Z

Вы пробовали просто:

names(newprice)[1]<-"premium"

?

Scott C Wilson · Answer 5 · 2015-03-19T21-04-00.000Z

Новый рекомендуемый способ сделать это - использовать функцию setNames. Видеть ?setNames. Поскольку это создает новую копию data.frame, обязательно присвойте результат оригиналу data.frame, если это ваше намерение.

data_frame <- setNames(data_frame, c("premium","change","newprice"))

Более новые версии R дадут вам предупреждение, если вы используете colnames в некоторых вариантах, предложенных более ранними ответами.

Если бы это был data.table вместо этого, вы могли бы использовать функцию data.table setNames, которая может изменять определенные имена столбцов или имя одного столбца по ссылке:

setnames(data_table, "old-name", "new-name")

думаю, что это было запрошено для data.frame, а не data.table
@ Helix123 решение работает и для data.frame

Desta Haileselassie Hagos · Answer 6 · 2016-01-10T20-32-00.000Z

У меня была такая же проблема, и этот фрагмент кода работал у меня.

names(data)[names(data) == "oldVariableName"] <- "newVariableName"

Короче говоря, этот код выполняет следующие действия:

names(data) просматривает все имена в фрейме данных (data)

[names(data) == oldVariableName] извлекает имя переменной (oldVariableName), которую вы хотите переименовать, и <- "newVariableName" назначает новое имя переменной.

Как бы это работало, если бы у вас был вектор, например, с 3 oldVariableNames?

Adam Erickson · Answer 7 · 2014-11-01T00-01-00.000Z

Аналогично другим:

cols <- c("premium","change","newprice")
colnames(dataframe) <- cols

Достаточно просто и легко изменить.

discipulus · Answer 8 · 2016-01-25T14-21-00.000Z

Если вам нужно переименовать не все, кроме нескольких столбцов, сразу, когда вы знаете только старые имена столбцов, вы можете использовать функцию colnames и %in%. Пример:

df = data.frame(bad=1:3, worse=rnorm(3), worst=LETTERS[1:3])

   bad      worse    worst
1   1 -0.77915455       A
2   2  0.06717385       B
3   3 -0.02827242       C

Теперь вы хотите изменить "плохое" и "худшее" на "хорошее" и "лучшее". Вы можете использовать

colnames(df)[which(colnames(df) %in% c("bad","worst") )] <- c("good","best")

В результате получается

  good      worse  best
1    1 -0.6010363    A
2    2  0.7336155    B
3    3  0.9435469    C

Этот код предполагает порядок имен столбцов, равный порядку вставок

Baykal · Answer 9 · 2013-01-31T21-35-00.000Z

8

Вы можете просто выполнить редактирование:

newprice <- edit(newprice)

и измените имя столбца вручную.

Baykal 31 янв. 2013, в 21:35

0

Разве это не работает только для векторных и факторных элементов? > locanatmodelset<-edit(locanatmodelset) Error in edit.data.frame(locanatmodelset) : can only handle vector and factor elements
vagabond 27 июль 2014, в 17:04
0

Это работает для фреймов данных по крайней мере. Это то, что я знаю.
Baykal 30 июль 2014, в 01:25
0

Да, прости! Это хорошее быстрое решение.
vagabond 18 фев. 2015, в 00:14

Показать ещё 1 комментарий

ngamita · Answer 10 · 2013-07-01T14-52-00.000Z

попробовать:

names(newprice) <- c("premium", "change", "newprice")

jangorecki · Answer 11 · 2015-12-10T14-11-00.000Z

Просто чтобы исправить и слегка расширить ответ Скотта Уилсона.
Вы также можете использовать функцию data.table setnames для data.frames.

Не ожидайте ускорения операции, но вы можете ожидать, что setnames будет более эффективным для потребления памяти, поскольку он обновляет имена столбцов по ссылке. Это можно отслеживать с помощью функции address, см. Ниже.

library(data.table)
set.seed(123)
n = 1e8

df = data.frame(bad=sample(1:3, n, TRUE), worse=rnorm(n))
address(df)
#[1] "0x208f9f00"
colnames(df) <- c("good", "better")
address(df)
#[1] "0x208fa1d8"
rm(df)

dt = data.table(bad=sample(1:3, n, TRUE), worse=rnorm(n))
address(dt)
#[1] "0x535c830"
setnames(dt, c("good", "better"))
address(dt)
#[1] "0x535c830"
rm(dt)

Итак, если вы нажмете на свои пределы памяти, вы можете использовать этот вариант вместо этого.

Mehul Katara · Answer 12 · 2018-03-13T09-38-00.000Z

Мои имена столбцов, как показано ниже

colnames(t)
[1] "Class"    "Sex"      "Age"      "Survived" "Freq"

Я хочу изменить имя столбца класса и пола

colnames(t)=c("STD","Gender","AGE","SURVIVED","FREQ")

Chris · Answer 13 · 2016-05-20T00-50-00.000Z

Это может быть полезно:

rename.columns=function(df,changelist){
  #renames columns of a dataframe
  for(i in 1:length(names(df))){
    if(length(changelist[[names(df)[i]]])>0){
      names(df)[i]= changelist[[names(df)[i]]]
    }
  }
  df
}

DF = rename.columns(DF, список (old.column = 'new.column.name'))

Aayush Agrawal · Answer 14 · 2015-04-18T09-24-00.000Z

Вы могли бы прямо сделать

names(newprice) <- c("premium","change","newprice")

Используемая вами команда paste принимает по два аргумента. Он работает как функция concatenate в excel, поэтому он дает вам ошибку, я думаю.

Чем этот ответ отличается от поста ngamita?
Сожалею. Я хотел выделить причину, по которой команда вставки выдает ему ошибку.

sbha · Answer 15 · 2018-07-04T12-30-00.000Z

Есть несколько вариантов с dplyr::rename() и dplyr::select():

library(dplyr)

mtcars %>% 
  tibble::rownames_to_column('car_model') %>%                            # convert rowname to a column. tibble must be installed.
  select(car_model, est_mpg = mpg, horse_power = hp, everything()) %>%   # rename specific columns and reorder
  rename(weight = wt, cylinders = cyl) %>%                               # another option for renaming specific columns that keeps everything by default
  head(2)
      car_model est_mpg horse_power cylinders disp drat weight  qsec vs am gear carb
1     Mazda RX4      21         110         6  160  3.9  2.620 16.46  0  1    4    4
2 Mazda RX4 Wag      21         110         6  160  3.9  2.875 17.02  0  1    4    4

Существует также три области действия dplyr::rename(): dplyr::rename_all() для всех имен столбцов, dplyr::rename_if() для условного таргетинга имен столбцов и dplyr::rename_at() для выбора именованных столбцов. Следующий пример заменяет пробелы и точки подчеркиванием и преобразует все в нижний регистр:

iris %>%  
  rename_all(~gsub("\\s+|\\.", "_", .)) %>% 
  rename_all(tolower) %>% 
  head(2)
  sepal_length sepal_width petal_length petal_width species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa

dplyr::select_all() также можно использовать аналогичным образом:

iris %>%  
  select_all(~gsub("\\s+|\\.", "_", .)) %>% 
  select_all(tolower) %>% 
  head(2)
  sepal_length sepal_width petal_length petal_width species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa

Raghavan vmvs · Answer 16 · 2018-01-03T08-58-00.000Z

В случае, если у нас есть 2 кадра данных, следующие работы

 DF1<-data.frame('a', 'b')
 DF2<-data.frame('c','d')

Мы меняем имена DF1 следующим образом

 colnames(DF1)<- colnames(DF2)

Seyma Kalay · Answer 17 · 2019-01-13T23-32-00.000Z

Получение данных с выбранными столбцами

get.the.df <- read_excel("df.xls") %>%    
          select("X1","X2","X3");names(get.the.df)

изменить имя столбцов get.the.df colnames(get.the.df) <- c("X22","X11","X33");names(get.the.df)