Выполните группировку с запросом, используемым в аргументе для linregress

Question

Выполните группировку с запросом, используемым в аргументе для linregress

1

Я разделил блок данных "full_df2" с помощью столбца "фильтр". Затем я помещаю различные имена групп фильтров в список "unique_list". Я хочу выполнить итерацию через свой фреймворк с помощью следующего кода, чтобы я мог получить график для каждой группы. "Рейтинг" и "hhs" - это столбцы в моем кадре данных, на которые я буду запускать регрессию.

Когда я запускаю код ниже, я получаю эту ошибку. ValueError: слишком много значений для распаковки (ожидается 4). Я попытался добавить.split(',') в конце строки 2, но он не помогает. Я занимаюсь серфингом через доски, пытаясь преодолеть эту ошибку. Я новичок в Python. Таким образом, любая помощь и объяснение были бы весьма признательны.

Вот некоторые примеры данных и реальный код, который я использовал.

    full_df2 = np.array([['Letter', 'Sync', 'Status', 'filter', 'Rating', 'hhs'],
                ['A', 'And', 'Off', 'A And Off', .4, 300],
                ['A', 'And', 'On', 'A And On', .5, 300]
                ['A', 'Or', 'Off', 'A Or Off', .7, 300]
                ['A', 'Or', 'On', 'A Or On', .3, 300]
                ['A', 'Between', 'Off', 'A Between Off', .6, 300]
                ['A', 'Between', 'On', 'A Between On', .4, 300]
                ['A', 'And', 'Off', 'A And Off', .6, 400],
                ['A', 'And', 'On', 'A And On', .4, 400]
                ['A', 'Or', 'Off', 'A Or Off', .3, 400]
                ['A', 'Or', 'On', 'A Or On', .4, 400]
                ['A', 'Between', 'Off', 'A Between Off', .3, 400]
                ['A', 'Between', 'On', 'A Between On', .8, 400]
                ['A', 'And', 'Off', 'A And Off', .4, 250],
                ['A', 'And', 'On', 'A And On', .5, 250]
                ['A', 'Or', 'Off', 'A Or Off', .7, 250]
                ['A', 'Or', 'On', 'A Or On', .3, 250]
                ['A', 'Between', 'Off', 'A Between Off', .6, 250]
                ['A', 'Between', 'On', 'A Between On', .4, 250]
                ])

    unique_df = dict(tuple(full_df2.groupby(['Letter', 'Sync', 'Status', 'filter'])))
    unique_list = ([x[-1] for x in unique_df])
    for x in unique_list:
       print (x)


for p in unique_list:
  slope, intercept, r_value, p_value, std_err = stats.linregress(full_df2.query("filter == @p")[['rating']], full_df2.query("filter == @p")[['hhs']])
  filter_df = full_df2.query("filter == @p")
  ax = sns.regplot(x="rating", y="hhs", data=filter_df, color='b', 
  line_kws={'label':"y={0:.1f}x+{1:.1f}".format(slope,intercept)})
  ax.legend()
  ax.set_title(p)
  plt.show() 
  print(slope)

Это полная ошибка:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-29-75511dada630> in <module>()
      1 for p in unique_list:
----> 2     slope, intercept, r_value, p_value, std_err = stats.linregress(full_df2.query("filter == @p")[['rating']], full_df2.query("filter == @p")[['hhs']])
      3     #result = [stats.linregress(data[key]['num'],data[key]['com']) for key in keys]
      4     #slope, intercept, r_value, p_value, std_err =
      5     #.split(',')

~\AppData\Local\Continuum\anaconda3\lib\site-packages\scipy\stats\_stats_mstats_common.py in linregress(x, y)
     91 
     92     # average sum of squares:
---> 93     ssxm, ssxym, ssyxm, ssym = np.cov(x, y, bias=1).flat
     94     r_num = ssxym
     95     r_den = np.sqrt(ssxm * ssym)

ValueError: too many values to unpack (expected 4)

SoSincere3 23 авг. 2018, в 07:11

Источник

0

Не могли бы вы добавить образец данных? и полное сообщение об ошибке, чтобы увидеть, где именно это происходит ...
Qusai Alothman 23 авг. 2018, в 07:56
0

Что произойдет, если вы напечатаете строку 2, а не назначите ее?
piman314 23 авг. 2018, в 09:38
0

@QusaiAlothman Я добавил образец данных и полное сообщение об ошибке.
SoSincere3 23 авг. 2018, в 15:00
0

@ncfirth Я получаю ту же ошибку, когда пытаюсь напечатать, а не назначать ее.
SoSincere3 23 авг. 2018, в 15:00
1

Это странно. Я всегда пытаюсь сгладить свои входные данные для массивов numy, можно сгладить некоторые ошибки, вы можете попробовать full_df2.query("filter == @p")[['rating']] -> full_df2.query("filter == @p")[['rating']].vдля обоих входов?piman314 23 авг. 2018, в 15:24




0

@ncfirth Хм. Я думаю, что вы на правильном пути. Я проверил форму print(full_df2.query("filter == @p")[['rating']].sShape) и она (53,1). Я попытался добавить .values но это была та же самая форма.

SoSincere3
23 авг. 2018, в 16:36






1

Если вы также добавите .flatten() ?

piman314
23 авг. 2018, в 16:40






0

@p")[['rating']].vncfirth Это так прекрасно !!! Я использовал full_df2.query("filter == @p")[['rating']].vp")[['rating']].value.flatten() и full_df2.query("filter == @p")[['rating']].vp")[['rating']].value.flatten() и все заработало !!! Огромное спасибо!!!. Будете ли вы публиковать в качестве ответа, чтобы я мог принять это?

SoSincere3
23 авг. 2018, в 19:11


Показать ещё 6 комментариев




Поделиться:



Теги:

python


pandas


scikit-learn







1 ответ



1

Лучший ответ


 Согласно нашим комментариям выше, проблема, которую вы имеете, - это форма вашего ввода. Самый простой способ заставить его работать - изменить вход linregress на это:
 stats.linregress(full_df2.query("filter == @p")['rating'], full_df2.query("filter == @p")['hhs'])




  Лично я бы написал его следующим образом:
 stats.linregress(full_df2.loc[full_df2.filter == p, 'rating'], full_df2.loc[full_df2.filter == p, 'hhs'])



piman314
24 авг. 2018, в 07:50

Поделиться











Ещё вопросы

1Datagrid, не показывать детали при нажатии кнопки
1Как сделать запрос к инвертированному индексу с нефиксированным количеством ключевых слов?
0Как отличить s от ş в подобном поиске
1gTTS Python Script в фоновом режиме получает tcgetattr (): неподходящий ioctl для устройства
0Несколько раскрывающихся не работает в HTML
0Попытка получить данные через связанную таблицу в Laravel
1Обещание Resolve возвращает 2 массива один неопределенный
0Отключить ввод в AutoCompleteBox
0развернуть и свернуть Просмотр функциональности в Angularjs
0Почему не работает моя быстрая сортировка
0Javascript - загрузка изображений
0Возвращает массив строк даты для диапазона дат в php 5.2
1Код для создания личности в онтологии?
0MySQL: возможно ли ПОЛУЧИТЬ ПОЛЕ в ОБНОВЛЕНИИ?
1Нужно конвертировать действительные значения даты и вывести ошибочные значения в Python
0Ошибка jQuery только в IE8 «Объект не поддерживает это свойство или метод»
1jar 2.2: есть ли замена класса GenericObjectPool.Config?
1Проблема: Перекомпилировать с -Xlint: не проверено для деталей
1Сортировать список по имени, дате и иерархии
1Как запросить предложение для клиента Java Solr?
0Избегание случайных указателей в условиях, включающих AND
0php добавляет новые поля в массив и отображает его
1Thread.sleep () не позволяет другим потокам работать?
0MySQL разъем в Python не работает
0Создать простой список задач J Query
0Объявите переменную в базе данных MySQL «только для чтения»
0Фокус AngularJS после создания нового элемента
0{float: left;} не работает
0Изменить первичные ключи массива
0Хранить индексы геометрии
1Linq Queryable отсутствует актерский состав?
1Ошибка метеора: ENOTEMPTY: каталог не пуст
1C # - InstallUtil 32bit устанавливает службу, но выдает ошибку при запуске
1получение данных из firebase и создание списка с помощью флажка
1Проверяйте Html.DropDownListFor, а не отправляйте ошибочное значение, когда httpPost
1изменение цвета рамки текстового поля, если проверка не удалась
1java.lang.NullPointerException: попытка чтения из поля 'android.view.View android.support.v7.widget.RecyclerView $ ViewHolder.itemView'
1тип безопасности (mypy) для параметров функции при использовании * args
1Объединение данных в цикле
1Не удается найти сертификат ни в хранилище LocalMachine, ни в хранилище CurrentUser - несоответствие имени удаленного сертификата
1Python - ускорить итерацию панд
0Обработка одиночного и многомерного массива из API
3ImportError: нет модуля с именем 'yaml'
1Сохранить ответ на сервере при отключении сетевого подключения
0Скрыть / показать веб-часть, щелкнув гиперссылку в карусели Sharepoint 2010
0Фон раздела div имеет необъяснимые отступы. Почему?
0продолжительность хранения функций, структур, классов, перечислений и объединений
0Обновите столбец, используя порядок запроса выбора по убыванию наибольшего значения
0Вызвать метод jquery для динамически добавленного элемента DOM
0Пример c ++ DirectInput извлекает немедленные данные из джойстика

Не могли бы вы добавить образец данных? и полное сообщение об ошибке, чтобы увидеть, где именно это происходит ...
Что произойдет, если вы напечатаете строку 2, а не назначите ее?
@QusaiAlothman Я добавил образец данных и полное сообщение об ошибке.
@ncfirth Я получаю ту же ошибку, когда пытаюсь напечатать, а не назначать ее.
Это странно. Я всегда пытаюсь сгладить свои входные данные для массивов numy, можно сгладить некоторые ошибки, вы можете попробовать full_df2.query("filter == @p")[['rating']] -> full_df2.query("filter == @p")[['rating']].vдля обоих входов?
@ncfirth Хм. Я думаю, что вы на правильном пути. Я проверил форму print(full_df2.query("filter == @p")[['rating']].sShape) и она (53,1). Я попытался добавить .values но это была та же самая форма.
@p")[['rating']].vncfirth Это так прекрасно !!! Я использовал full_df2.query("filter == @p")[['rating']].vp")[['rating']].value.flatten() и full_df2.query("filter == @p")[['rating']].vp")[['rating']].value.flatten() и все заработало !!! Огромное спасибо!!!. Будете ли вы публиковать в качестве ответа, чтобы я мог принять это?

piman314 · Accepted Answer · 2018-08-24T07-50-00.000Z

Согласно нашим комментариям выше, проблема, которую вы имеете, - это форма вашего ввода. Самый простой способ заставить его работать - изменить вход linregress на это:

stats.linregress(full_df2.query("filter == @p")['rating'], full_df2.query("filter == @p")['hhs'])

Лично я бы написал его следующим образом:

stats.linregress(full_df2.loc[full_df2.filter == p, 'rating'], full_df2.loc[full_df2.filter == p, 'hhs'])