Я не знаю, возможно ли это... не сталкивался с этим в сети. В Excel я отформатировал данные кросс-таблицы с разбивкой по местоположению/городу в одной электронной таблице для тысяч строк. Простой пример ниже.
Я хочу запустить анализатор Python Excel, который берет эти отформатированные данные и форматирует их в формате необработанных данных, чтобы я мог загрузить их в таблицу базы данных. Это возможно? Желаемый результат будет выглядеть примерно так.
У Pandas есть метод чтения файлов Excel, который довольно аккуратен, поскольку вы получаете из него фрейм данных, что, вероятно, облегчает сканирование и настраиваемый анализ.
import pandas as pd
# Reads the excel file
xl = pd.ExcelFile(file_path)
# Parses the desired sheet
df = xl.parse(sheet_name)
# To host all your table title indices
tbl_title = []
# To locate the title of your tables, I think you can do a sampling of that column to ascertain all the row numbers that contain the table titles
for i, n in enumerate(df.loc[:, column_name]):
if n == 'P': # The first column in your table header as the cue
tbl_title.append(i - 1) # This would be the row index for Frisco, Dallas etc.
Когда у вас есть индексы всех названий таблиц, вы можете просто создать другую функцию чтения таблиц, чтобы перебирать кадры данных в определенных строках.