Прочитайте данные секционированного Excel, преобразуйте, затем выведите в необработанный формат для базы данных

1

Я не знаю, возможно ли это... не сталкивался с этим в сети. В Excel я отформатировал данные кросс-таблицы с разбивкой по местоположению/городу в одной электронной таблице для тысяч строк. Простой пример ниже.

пример

Я хочу запустить анализатор Python Excel, который берет эти отформатированные данные и форматирует их в формате необработанных данных, чтобы я мог загрузить их в таблицу базы данных. Это возможно? Желаемый результат будет выглядеть примерно так.

Пример целевого выхода

  • 0
    Добро пожаловать на ТАК! Пожалуйста, покажите, какой код вы используете до сих пор, и где у вас возникла проблема.
Теги:
database
pandas
excel
xlrd

1 ответ

0

У Pandas есть метод чтения файлов Excel, который довольно аккуратен, поскольку вы получаете из него фрейм данных, что, вероятно, облегчает сканирование и настраиваемый анализ.

import pandas as pd

# Reads the excel file
xl = pd.ExcelFile(file_path)
# Parses the desired sheet
df = xl.parse(sheet_name)

# To host all your table title indices
tbl_title = []

# To locate the title of your tables, I think you can do a sampling of that column to ascertain all the row numbers that contain the table titles
for i, n in enumerate(df.loc[:, column_name]):
    if n == 'P': # The first column in your table header as the cue
        tbl_title.append(i - 1) # This would be the row index for Frisco, Dallas etc.

Когда у вас есть индексы всех названий таблиц, вы можете просто создать другую функцию чтения таблиц, чтобы перебирать кадры данных в определенных строках.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню