Возьмите 2D-список любых четных измерений и верните список, содержащий количество вещей для каждой сетки 2 X 2 (Python)

Question

Возьмите 2D-список любых четных измерений и верните список, содержащий количество вещей для каждой сетки 2 X 2 (Python)

1

Я пытаюсь сделать функцию, которая примет список, такой как:

l = [["A", 1, 2, 3, 4, 5],
     ["A", "A", 2, 3, 4, 5],
     [1, 2, 3, 4, 5, 5],
     ["A", "A", "A", "A", "A", "A"],
     ["A", 3, "A", 4, "A", "A"],
     [1, 3, 5, "A", 5, "A"]
     ]

и ключ, например "A". И предоставит список, содержащий int, в зависимости от того, сколько раз KEY появляется в 2D-списке в каждой ячейке 2x2. Так, например, функция

def count_in_grids(l, key):

вернусь

[3, 0, 0, 2, 2, 2, 1, 2, 3]

Пока у меня действительно плохой код, который я написал. У меня обычно возникают проблемы с управлением 2D-списками. Поскольку это фактически назначение, мне не разрешено использовать какую-либо библиотеку. Если кто-то может помочь мне понять и написать это, я буду глубоко этому благодарен.

Мой дрянной код, который я написал до сих пор:

def countInGrids(l, thing):
new_list = []  # created a final list that will be returned
count = 0
for line in range(0, len(l), 2):  # Access lines
    for el in range(0, line, 2):  # Access elements
        #count + count() of all elements in line[el] to line[el+1], 
        move 2 lines down and repeat.
        count += line[line[el]:line[el]+1].count(thing) 
        count += line+1[line[el]:line[el]+1].count(thing)

        new_list.append(count)
print(new_list)
return new_list

OUTPUT: строка 63, в countInGrids count + = line [line [el]: строка [el] +1]. Count (вещь) TypeError: объект 'int' не является индексируемым

PS: Если кому-то интересно, это мой первый семестр CS Lab

user3687547 21 сен. 2018, в 01:34

Источник

0

for line in range(0, len(l), 2): результате line становится целым числом. Но в вашем цикле вы пытаетесь проиндексировать его как массив или список. Это сообщение об ошибке здесь.
SpghttCd 20 сен. 2018, в 23:13
0

Поскольку сегодня я целый день перередактировал этот метод, я упустил такую простую ошибку. Я пытался запустить этот метод, используя для x в списке ранее, но все еще не работал, потому что я действительно не понимал, как это сделать.
user3687547 20 сен. 2018, в 23:28

Теги:

python

arrays

list

matrix

2 ответа

1

Заманчиво попытаться найти решение с нарезкой и пониманием сразу с места в карьер, но я думаю, что риск путаницы достаточно высок, чтобы было нормально начать с наивного решения.

Первый шаг - найти все углы суб-квадратов:

1 . 2 . 3 .
. . . . . .
4 . 5 . 6 .
. . . . . .
7 . 8 . 9 .
. . . . . .

Это подсчет вложенного цикла на 2, где угловая ячейка находится в (row, col).

Учитывая подквадр, пересечение его ячеек - это еще одна пара вложенных циклов с шагом 1:

1 2 x . x .
3 4 . . . .
x . x . x .
. . . . . .
x . x . x .
. . . . . .

Здесь каждый элемент находится в (row + i, col + j) где i и j - шаги внутреннего цикла.

После этого, это вопрос написания условного теста и добавления счетчика для каждого под-квадрата в список результатов.

Наконец, добавьте размер шага в качестве параметра по умолчанию, чтобы увеличить повторное использование.

Объединяя это:

def count_in_grids(l, key, size=2):
    result = []

    for row in range(0, len(l), size):
        for col in range(0, len(l[row]), size):
            result.append(0)

            for i in range(size):
                for j in range(size):
                    if key == l[row+i][col+j]:
                        result[-1] += 1

    return result

print(count_in_grids(l, "A"))

Здесь нужно повторить тест.

ggorlen 20 сен. 2018, в 22:11

0

Не быть слишком педантичным, поскольку он достаточно хорошо выражает более длительное время работы для больших объектов, но накладные расходы на нарезку будут только дополнительным линейным фактором. У вас все еще будет время выполнения полинома низкого порядка. Кроме того, я просто углубился в это, и фрагменты списка - это представления в исходном списке; кроме постоянного числа поисков указателей, однако они реализовали это, нет никаких дополнительных затрат при получении большого количества перекрывающихся фрагментов.
Hans Musgrave 21 сен. 2018, в 00:53
0

Я не уверен в деталях сложности времени нарезки за пределами «линейной», но я был бы рад изучить бенчмаркинг или провести дополнительные исследования, и мне было бы любопытно увидеть ваши источники. Я большой поклонник лаконичного Pythonic-кода, но в этом случае мне кажется очевидным, что OP нашел бы работающий и, несомненно, эффективный алгоритм намного быстрее, используя базовые циклы, чем сразу переходя к нарезке и подсчету. Позже я могу увидеть рефакторинг для трехслойного списка компоновок, но заслуга здесь не кажется мне такой очевидной или поучительной, как в других случаях.
ggorlen 21 сен. 2018, в 01:14
0

В документах в разделе «3.1.4. Списки» говорится, что срезы возвращают новый список, содержащий выбранные элементы (что делает это равносильным мелкой копии). Поскольку списки в Python передаются по ссылке, этот список списков будет храниться в виде списка ссылок (грубо можно отметить для подтверждения - время создания большого списка L по сравнению со списком [L] ).
Hans Musgrave 21 сен. 2018, в 02:14
0

Тем не менее, мне нравится ваш педагогический подход. Есть что сказать, чтобы начать с прямых петель и работать оттуда.
Hans Musgrave 21 сен. 2018, в 02:16
0

Я сделал бенчмаркинг , и вы правы, ваш подход более эффективен, что является образовательным и удивительным для меня. Я удалил этот компонент из своего ответа, который я оставлю немного дольше, чтобы посмотреть, будет ли он полезен, но да, похоже, Python может оптимизировать ваш код лучше, чем обычный цикл for.
ggorlen 21 сен. 2018, в 02:39
0

У моего подхода есть некоторые накладные расходы на создание объектов, и я лично также удивлен, что это быстрее. Я не думал, что это было на дрожжах хуже само по себе, но быстрее это неожиданно. Я думаю, что вы могли бы получить циклы быстрее, если вы предварительно инициализировали res вместо добавления O (n ^ 2) и если мы нашли какой-нибудь способ обойти два метода доступа и два дополнения, которые должны вычисляться последовательно и могут ' не может быть конвейеризовано в l[row+i][col+j] .
Hans Musgrave 21 сен. 2018, в 02:58
0

Да, так что подход на основе прямого цикла быстрее, когда вы заменяете внутренние диапазоны слайсами, чтобы получить блоки 2x2. Кроме того, обе версии существенно .count() избегая .count() и просто добавляя две вещи вручную. Это, вероятно, не так для больших размеров блоков. Встроенная функция sum() имеет аналогичную проблему. Рефакторинг обоих подходов позволяет избежать небольших внутренних диапазонов, не использовать sum() и не использовать count() , оба имеют сравнимое время выполнения (и повышение скорости на 30-50%).
Hans Musgrave 21 сен. 2018, в 03:10
0

Хорошо знать. Я узнал тонну из этой темы - спасибо!
ggorlen 21 сен. 2018, в 04:08

Показать ещё 6 комментариев

Ещё вопросы

for line in range(0, len(l), 2): результате line становится целым числом. Но в вашем цикле вы пытаетесь проиндексировать его как массив или список. Это сообщение об ошибке здесь.
Поскольку сегодня я целый день перередактировал этот метод, я упустил такую простую ошибку. Я пытался запустить этот метод, используя для x в списке ранее, но все еще не работал, потому что я действительно не понимал, как это сделать.
Не быть слишком педантичным, поскольку он достаточно хорошо выражает более длительное время работы для больших объектов, но накладные расходы на нарезку будут только дополнительным линейным фактором. У вас все еще будет время выполнения полинома низкого порядка. Кроме того, я просто углубился в это, и фрагменты списка - это представления в исходном списке; кроме постоянного числа поисков указателей, однако они реализовали это, нет никаких дополнительных затрат при получении большого количества перекрывающихся фрагментов.
Я не уверен в деталях сложности времени нарезки за пределами «линейной», но я был бы рад изучить бенчмаркинг или провести дополнительные исследования, и мне было бы любопытно увидеть ваши источники. Я большой поклонник лаконичного Pythonic-кода, но в этом случае мне кажется очевидным, что OP нашел бы работающий и, несомненно, эффективный алгоритм намного быстрее, используя базовые циклы, чем сразу переходя к нарезке и подсчету. Позже я могу увидеть рефакторинг для трехслойного списка компоновок, но заслуга здесь не кажется мне такой очевидной или поучительной, как в других случаях.
В документах в разделе «3.1.4. Списки» говорится, что срезы возвращают новый список, содержащий выбранные элементы (что делает это равносильным мелкой копии). Поскольку списки в Python передаются по ссылке, этот список списков будет храниться в виде списка ссылок (грубо можно отметить для подтверждения - время создания большого списка L по сравнению со списком [L] ).
Тем не менее, мне нравится ваш педагогический подход. Есть что сказать, чтобы начать с прямых петель и работать оттуда.
Я сделал бенчмаркинг , и вы правы, ваш подход более эффективен, что является образовательным и удивительным для меня. Я удалил этот компонент из своего ответа, который я оставлю немного дольше, чтобы посмотреть, будет ли он полезен, но да, похоже, Python может оптимизировать ваш код лучше, чем обычный цикл for.
У моего подхода есть некоторые накладные расходы на создание объектов, и я лично также удивлен, что это быстрее. Я не думал, что это было на дрожжах хуже само по себе, но быстрее это неожиданно. Я думаю, что вы могли бы получить циклы быстрее, если вы предварительно инициализировали res вместо добавления O (n ^ 2) и если мы нашли какой-нибудь способ обойти два метода доступа и два дополнения, которые должны вычисляться последовательно и могут ' не может быть конвейеризовано в l[row+i][col+j] .
Да, так что подход на основе прямого цикла быстрее, когда вы заменяете внутренние диапазоны слайсами, чтобы получить блоки 2x2. Кроме того, обе версии существенно .count() избегая .count() и просто добавляя две вещи вручную. Это, вероятно, не так для больших размеров блоков. Встроенная функция sum() имеет аналогичную проблему. Рефакторинг обоих подходов позволяет избежать небольших внутренних диапазонов, не использовать sum() и не использовать count() , оба имеют сравнимое время выполнения (и повышение скорости на 30-50%).
Хорошо знать. Я узнал тонну из этой темы - спасибо!

Hans Musgrave · Accepted Answer · 2018-09-20T21-39-00.000Z

Это, вероятно, немного неуклюжий, но перечислить понимание всегда можно.

def countInGrid(grid, key):
    return [sum([v[i:i+2].count(key) for v in grid[j:j+2]])
            for j in range(0, len(grid), 2) for i in range(0, len(grid[0]), 2)]

Исходя из этого, то, что он использует для создания сетки 2x2, является [v[i:i+2] for v in grid[j:j+2]. Это не очень эффективная операция, если вы делаете это во весь список списков несколько раз, но быстро записываете.

Чтобы подсчитать ключ, он сначала учитывается в каждой строке с помощью .count(key), а затем добавляет его для каждой из двух строк в вашей сетке 2x2, используя sum().

Последняя строка - это то, как вы выбираете, какую сетку 2x2 вы хотите посмотреть. Он указывает, где вы начнете и где закончите. Порядок i и j важен, если вы не хотите итерации по столбцам, а затем по строкам.

В понимании списка в основном есть все следующие небольшие компоненты, завернутые в более строгий синтаксис.

def count_row(v, key):
    return v.count(key)

def count_grid(grid, key):
    return sum(count_row(v, key) for v in grid)

def get_nxn(grid, i, j, n=2):
    return [v[i:i+n] for v in grid[j:j+n]]

def iter_block_row(grid, j):
    for i in range(0, len(grid[0]), 2):
        yield get_nxn(grid, i, j)

def iter_grid(grid):
    for j in range(0, len(grid), 2):
        # In Python 3.3+, use
        # yield from iter_block_row(grid, j)
        for g in iter_block_row(grid, j):
            yield g

def count_in_grid(grid, key):
    return [count_grid(g, key) for g in iter_grid(grid)]

Размышление о больших проблемах, состоящих из небольших частей, помогает сделать их управляемыми с любым опытом. Также полезно видеть, что вам не нужны какие-либо дополнительные синтаксические сахара и языковые трюки для достижения той же цели чистым способом.

Обратите внимание, что срезы в get_nxn() неэффективны. Это один из способов разложить проблему (и я думаю, что это самый простой способ мыслить концептуально), но это НЕ самый эффективный.

Обновление Я ошибался в работе get_nxn(). Похоже, что куски списков в Python не копируют данные, даже в Python 2. 7+. Операция get_nxn() выполняется в постоянное время по отношению к размеру grid, и при этом происходит быстрое постоянное время.

Ух ты! Вы сделали это менее чем за минуту. Большое спасибо, я действительно ценю это, особенно потому что это должно сегодня. Я действительно так плох в CS, хотя .... У меня ушел час, чтобы НЕ найти решение; (
Программирование требует практики. Ключ состоит в том, чтобы разбить вещи на маленькие, легко понятные части. Через секунду я отредактирую ответ с лучшим стилем, который будет легче понять.
Ах! Я понимаю, что ты здесь сделал. Из вашего объяснения я могу сказать, что я не использовал срезы должным образом, и я не правильно индексировал свои списки. Я лучше прочитаю сегодня вечером список и его встроенные функции. Еще раз спасибо за это объяснение и за нарушение этого для меня, я очень ценю это!