У меня есть два набора массивов, и я ищу индекс ближайшей точки в array2 к каждому значению в array1, например:
import numpy as np
from scipy.spatial import distance
array1 = np.array([[1,2,1], [4,2,6]])
array2 = np.array([[0,0,1], [4,5,0], [1,2,0], [6,5,0]])
def f(x):
return distance.cdist([x], array2 ).argmin()
def array_map(x):
return np.array(list(map(f, x)))
array_map(array1)
Этот код возвращает правильные результаты, но работает медленно, когда оба массива очень большие. Мне было интересно, можно ли сделать это как можно быстрее?
Благодаря @Max7CD вот рабочее решение, которое работает достаточно эффективно (по крайней мере, для моей цели):
from scipy import spatial
tree =spatial.KDTree(array2)
slitArray = np.split(array1, 2) #I split the data so that the KDtree doesn't take for ever and so that I can moniter progress, probably useless
listFinal = []
for elem in slitArray:
a = tree.query(elem)
listFinal.append(a[1])
print("Fnished")
b = np.array(listFinal).ravel()