Pandas Dataframe looping

Question

Pandas Dataframe looping

1

Я застрял в коде ниже. В принципе, я прохожу через первый столбец из 2 кадров данных с аналитическими именами циклов и "fedbatchname". Если эти две переменные находят совпадение в каждом фрейме данных, я хочу получить доступ к этому элементу фрейма данных на основе значения переменной цикла. Однако, когда я запускаю код, я получаю ключевую ошибку, которая возникает в строке после оператора if. По сути, я спрашиваю, как получить доступ к элементу фрейма данных, основанному на переменной цикла. Какие-либо предложения?

import pandas as pd
analyticaldata = pd.read_csv('SE-HPLC.csv', usecols = ['Sample ID','% 
Aggregate','% Monomer','% Fragment']) #loading data into pandas DataFrame
fedbatchdata = pd.read_csv('Culture Day Sheet.csv',usecols = 
['RUN_NUMBER','% Aggregate','% Monomer','% Fragment'])

for analyticalname in analyticaldata['Sample ID']: #for each element in 
first column of SE-HPLC worksheet
for fedbatchname in fedbatchdata['RUN_NUMBER']: #for each element in first column of Culture Day worksheet
    if analyticalname == fedbatchname: #if any of the names match
        fedbatchdata.ix[fedbatchdata.fedbatchname,'% Aggregate'] = analyticaldata[analyticalname]['% Aggregate']
        fedbatchdata.ix[fedbatchdata.fedbatchname,'% Monomer'] = analyticaldata.ix[analyticalname,'% Monomer']                  
        fedbatchdata.ix[fedbatchdata.fedbatchname,'% Fragment'] = analyticaldata.ix[analyticalname,'% Fragment']

EDIT: Вот некоторые примеры данных для обоих кадров данных, я приношу свои извинения за это. Ядро fedbatch должно быть пустым, я пытаюсь скопировать значения из аналитического фрейма в фреймворк fedbatch.

Analytical dataframe:
SAMPLE_ID:    % Aggregate    % Monomer    % Fragment
A               2             4             1.5
B               1             4             6
C               5             5             2.1
D               3             7.1           10

Fed Batch Dataframe:
RUN_NUMBER:    % Aggregate    % Monomer    % Fragment
B                                        
A                                                                                   
C
D

A.P 15 окт. 2018, в 15:29

Источник

0

Можете ли вы добавить образец данных? Выглядит так, как будто бы нуждаются в analyticaldata.merge(fedbatchdata, left_on=['Sample ID'], right_on=['RUN_NUMBER'])
jezrael 15 окт. 2018, в 13:16
0

Пожалуйста, добавьте это к вопросу.
jezrael 15 окт. 2018, в 13:21
0

Должен ли я объединить два кадра данных, чтобы просто получить доступ к элементу кадра данных? Я также не понимаю, как добавить пример данных, так как он в Excel, и когда я вставляю ячейки, он теряет формат Excel
A.P 15 окт. 2018, в 13:25
0

Проверьте, как предоставить отличный пример панд и минимальный, полный и проверяемый пример
jezrael 15 окт. 2018, в 13:26
0

Итак, analyticaldata.merge(fedbatchdata, left_on=['Sample ID'], right_on=['RUN_NUMBER'], how='left') ?
jezrael 15 окт. 2018, в 13:37
0

@jezrael Это работает? Где вы добавили эту строку кода?
A.P 15 окт. 2018, в 13:38
0

Использовать мой код после fedbatchdata = pd.read_csv('Culture Day Sheet.csv',usecols = ['RUN_NUMBER','% Aggregate','% Monomer','% Fragment'] , код из for analyticalname in analyticaldata['Sample ID']: до конца должен быть удален
jezrael 15 окт. 2018, в 13:44

Показать ещё 5 комментариев

Теги:

python

pandas

dataframe

1 ответ

Ещё вопросы

Можете ли вы добавить образец данных? Выглядит так, как будто бы нуждаются в analyticaldata.merge(fedbatchdata, left_on=['Sample ID'], right_on=['RUN_NUMBER'])
Пожалуйста, добавьте это к вопросу.
Должен ли я объединить два кадра данных, чтобы просто получить доступ к элементу кадра данных? Я также не понимаю, как добавить пример данных, так как он в Excel, и когда я вставляю ячейки, он теряет формат Excel
Проверьте, как предоставить отличный пример панд и минимальный, полный и проверяемый пример
Итак, analyticaldata.merge(fedbatchdata, left_on=['Sample ID'], right_on=['RUN_NUMBER'], how='left') ?
@jezrael Это работает? Где вы добавили эту строку кода?
Использовать мой код после fedbatchdata = pd.read_csv('Culture Day Sheet.csv',usecols = ['RUN_NUMBER','% Aggregate','% Monomer','% Fragment'] , код из for analyticalname in analyticaldata['Sample ID']: до конца должен быть удален

jezrael · Accepted Answer · 2018-10-15T11-39-00.000Z

1

Лучший ответ

Используйте merge с столбцом переименования, чтобы избежать его в выводе DataFrame с только столбцом RUN_NUMBER fedbatchdata: RUN_NUMBER из fedbatchdata:

df = (fedbatchdata[['RUN_NUMBER']]
                    .merge(analyticaldata.rename(columns={'Sample ID':'RUN_NUMBER'}), 
                          on=['RUN_NUMBER'], 
                          how='left'))
print (df)
  RUN_NUMBER  % Aggregate  % Monomer  % Fragment
0          B            1        4.0         6.0
1          A            2        4.0         1.5
2          C            5        5.0         2.1
3          D            3        7.1        10.0

jezrael 15 окт. 2018, в 11:39

0

Код работал бы, если бы значения в RUN_NUMBERS и SAMPLE_ID были в одном и том же порядке, но это не так, поэтому я считаю, что мне нужно пройтись по столбцу, чтобы найти совпадения, а затем скопировать данные, нет?
A.P 15 окт. 2018, в 13:45
0

@AP - Ответ отредактирован, поменялся местами DataFrames.
jezrael 15 окт. 2018, в 13:46
0

Я получаю еще одну ошибку: KeyError: 'RUN_NUMBER'. Любые предложения @jezrael
A.P 15 окт. 2018, в 13:52
0

Что такое print (fedbatchdata.columns) ?
jezrael 15 окт. 2018, в 13:53
0

Вот что дает мне компилятор: индекс (['RUN_NUMBER', '% Aggregate', '% Monomer', '% Fragment'], dtype = 'object')
A.P 15 окт. 2018, в 13:55
0

@AP - я вижу проблему, нужно 'SAMPLE_ID' на 'SAMPLE ID'
jezrael 15 окт. 2018, в 13:57
0

Он по-прежнему дает мне тот же KeyError, даже после того, как я изменил SAMPLE_ID на SAMPLE ID
A.P 15 окт. 2018, в 14:00
0

Что такое print (analyticaldata.columns) ?
jezrael 15 окт. 2018, в 14:00
0

Это то, что дает мне компилятор, когда я вхожу в print (analyddata.columns): Index (['Sample ID', '% Aggregate', '% Monomer', '% Fragment'], dtype = 'object')
A.P 15 окт. 2018, в 14:03
0

Поэтому необходимо SAMPLE ID изменен Sample ID
jezrael 15 окт. 2018, в 14:04
0

Спасибо! Код запустился, но я не вижу каких-либо изменений в файле CSV, вы знаете что-нибудь об этом?
A.P 15 окт. 2018, в 14:09
0

Последняя необходимость df.to_csv('out.csv', index=False)
jezrael 15 окт. 2018, в 14:10
1

Хорошо, большое спасибо! Я многое узнал о CSV и пандах!
A.P 15 окт. 2018, в 14:15

Показать ещё 11 комментариев