Заменить цикл в Python на эквивалент поиска в Matlab

Question

Заменить цикл в Python на эквивалент поиска в Matlab

1

Предположим, что у меня есть отсортированный массив кортежей, который сортируется по первому значению. Я хочу найти первый индекс, где выполняется условие для первого элемента кортежа. например, как заменить следующий код

test_array = [(1,2),(3,4),(5,6),(7,8),)(9,10)]
min_value = 5
index = 0
for c in test_array:
        if c[0] > min_value:
           break
        else:
            index = index + 1

С эквивалентом поиска в Matlab?

то есть. В конце этого цикла я ожидаю получить 3, но я хотел бы сделать это более эффективным. Я прекрасно использую numpy для этого. Я пробовал использовать argmax, но безрезультатно.

Спасибо

LostInTheFrequencyDomain 09 фев. 2017, в 21:51

Источник

0

Разве вы не имеете в виду, что хотите найти последний индекс, где выполняется условие, а не первый? Потому что это то, что вы делаете здесь. Можете ли вы добавить краткий пример того, как вы будете делать это в Matlab, чтобы мы могли лучше понять, что вы спрашиваете?
Anonymous 09 фев. 2017, в 20:12

Теги:

python

numpy

matlab

3 ответа

0

В общем случае numpy where используется по типу, аналогичному MATLAB find. Однако с точки зрения эффективности я where нельзя управлять, чтобы вернуть только первый найденный элемент. Итак, с вычислительной точки зрения, то, что вы здесь делаете, не является менее менее эффективным.

эквивалентом where будет

index = numpy.where(numpy.array([t[0] for t in test_array]) >= min_value)
index = index[0] - 1

heyiamt 09 фев. 2017, в 18:05

0

Вы можете использовать numpy для указания элементов, которые подчиняются условиям, а затем использовать argmax(), чтобы получить индекс первого

import numpy
test_array = numpy.array([(1,2),(3,4),(5,6),(7,8),(9,10)])
min_value = 5

print (test_array[:,0]>min_value).argmax()

если вы хотите найти все элементы, удовлетворяющие условию, использование может заменить argmax() на nonzero()[0]

yuval 09 фев. 2017, в 17:47

0

Я бы сказал, что это излишне
Anonymous 09 фев. 2017, в 20:20
0

Я хотел бы индекс, где условие выполняется. Далее это вернулось (3,4). Я хочу вернуть индекс (7,8). Спасибо
LostInTheFrequencyDomain 09 фев. 2017, в 20:23
0

Извините, была опечатка. Теперь работает
Yuval Atzmon 09 фев. 2017, в 20:28
0

@jphollowed, что ты имеешь в виду под излишним? Это простое решение в одну строку.
Yuval Atzmon 09 фев. 2017, в 20:46
0

@ user2476373 Просто потому, что numpy не нужен для чего-то, что вы можете сделать тривиально с помощью встроенных Python. Но тем более, что nonzero() делает больше, чем нужно. Я не считаю чистым кодирование для немедленного индексирования возврата функции, потому что вам нужна только его часть. Можно также использовать более подходящий инструмент
Anonymous 09 фев. 2017, в 21:28
0

@jphollowed, спасибо за отзыв. Я отредактировал ответ и заменил ненулевой на argmax, и теперь это делает решение чище. Re библиотеки, я не согласен с вами. Я не вижу разницы между import bisect в качестве принятого ответа или import numpy как в этом ответе. Я думаю, что Numpy предпочтительнее, поскольку он делает код более кратким, читабельным и во много раз быстрее.
Yuval Atzmon 10 фев. 2017, в 14:04

Показать ещё 4 комментария

Ещё вопросы

Разве вы не имеете в виду, что хотите найти последний индекс, где выполняется условие, а не первый? Потому что это то, что вы делаете здесь. Можете ли вы добавить краткий пример того, как вы будете делать это в Matlab, чтобы мы могли лучше понять, что вы спрашиваете?
Я хотел бы индекс, где условие выполняется. Далее это вернулось (3,4). Я хочу вернуть индекс (7,8). Спасибо
Извините, была опечатка. Теперь работает
@jphollowed, что ты имеешь в виду под излишним? Это простое решение в одну строку.
@ user2476373 Просто потому, что numpy не нужен для чего-то, что вы можете сделать тривиально с помощью встроенных Python. Но тем более, что nonzero() делает больше, чем нужно. Я не считаю чистым кодирование для немедленного индексирования возврата функции, потому что вам нужна только его часть. Можно также использовать более подходящий инструмент
@jphollowed, спасибо за отзыв. Я отредактировал ответ и заменил ненулевой на argmax, и теперь это делает решение чище. Re библиотеки, я не согласен с вами. Я не вижу разницы между import bisect в качестве принятого ответа или import numpy как в этом ответе. Я думаю, что Numpy предпочтительнее, поскольку он делает код более кратким, читабельным и во много раз быстрее.

Jean-François Fabre · Accepted Answer · 2017-02-09T17-33-00.000Z

Поскольку список сортируется, и если вы знаете максимальное возможное значение для второго элемента (или может быть только один элемент с тем же самым первым значением), вы можете применить bisect в списке кортежей (возвращает сортировка позиции в списке)

import bisect
test_array = [(1,2),(3,4),(5,6),(7,8),(9,10)]
min_value = 5

print(bisect.bisect_left(test_array,(min_value,10000)))

Hardcoding to 10000 плохой, поэтому, если у вас есть только целые числа, вы можете сделать это:

print(bisect.bisect_left(test_array,(min_value+1,)))

результат: 3

Если у вас есть floats (также работает с целыми числами), вы можете использовать sys.float_info.epsilon следующим образом:

print(bisect.bisect_left(test_array,(min_value*(1+sys.float_info.epsilon),)))

Он имеет сложность O(log(n)), поэтому он намного лучше, чем простой цикл for, когда есть много элементов.

Я не знал о делении. Отлично! Благодарю.
да, это хорошо Смотрите мое редактирование. В зависимости от данных мой предыдущий ответ может не получиться.
Похоже, вы можете использовать None в качестве второго параметра вместо 1000.
не в Python 3 вы не можете unorderable types: NoneType() < int() . Но без элемента это работает (но это минимальное значение, а не максимальное): >>> (5,) < (5,-30000) yields True