Как выделить память устройства для моего массива указателей в CUDA?

Question

Как выделить память устройства для моего массива указателей в CUDA?

0

На моем хосте у меня есть следующие структуры данных:

typedef struct point{
   int x;
   int y;
}Point;

 typedef struct pair{
     Point i;
     Point j;
     float cost;
 }Pair;

Pair* pairs[n];   // allocates an array of pointers to pair

Теперь я должен скопировать "пары" на GPU. Итак, я объявляю следующий указатель:

Pair **d_pair;

и выделите память, используя следующее:

cudaMalloc((void**)d_pair,(sizeof(Pair)+sizeof(Pair*))*n);

Теперь я копирую с хоста на устройство:

cudaMempy(d_pair,pair,(sizeof(Pair)+sizeof(Pair*))*n),cudaMemcpyHostToDevice);

Прототип ядра получает d_pair как:

__global__ my_kernel(Pair* d_pair[], ... ){ 
...
}

Должна ли следующая последовательность заявлений работать по назначению? Если нет, какие модификации я делаю? В принципе, я хочу скопировать пары пар [n]; как таковой для "d_pair". Как мне это сделать?

pymd 31 янв. 2014, в 12:07

Источник

1

Если вы можете переключиться на массив Pair вместо массива указателей на Pair , то копирование данных может быть простым с относительно небольшими изменениями в последовательности, которую вы обрисовали. В противном случае процесс значительно усложняется и потребует цикла с несколькими этапами. Если вы будете искать в двумерном массиве cuda (массив указателей на данные фактически является двумерным массивом), вы получите представление о сложности.
Robert Crovella 31 янв. 2014, в 14:52

Теги:

c++

c

cuda

1 ответ

Ещё вопросы

Если вы можете переключиться на массив Pair вместо массива указателей на Pair , то копирование данных может быть простым с относительно небольшими изменениями в последовательности, которую вы обрисовали. В противном случае процесс значительно усложняется и потребует цикла с несколькими этапами. Если вы будете искать в двумерном массиве cuda (массив указателей на данные фактически является двумерным массивом), вы получите представление о сложности.

Joky · Answer 1 · 2014-01-31T08-51-00.000Z

Это не сработает: вы отправляете массив указателей, но не сами объекты. У вас должен быть массив (или вектор) пары:

Pair pairs[n];

А потом:

Pair *d_pair;
cudaMalloc((void**)&d_pair,sizeof(Pair)*n);
cudaMempy(d_pair,pairs,sizeof(Pair)*n,cudaMemcpyHostToDevice);

Кстати, это:

cudaMempy(d_pair,pair,(sizeof(Pair)+sizeof(Pair*))*n),cudaMemcpyHostToDevice);

не имеет смысла, вы выделяете место для указателя AND a Pair. Ваша копия использует одно и то же выражение (sizeof (Pair) +sizeof (Pair *)) * n), но пары массивов (n * sizeof (Pair *)), поэтому вы копируете неопределенную память.

Подскажите, пожалуйста, какие изменения я должен внести в код?
Я не верю, что обновление верное. Это должна быть Pair *d_pair; cudaMalloc((void **)&d_pair, sizeof(Pair)*n); cudaMemcpy(d_pair, pairs, sizeof(Pair)*n, cudaMemcpyHostToDevice);
Вы правы, я скопировал / вставил исходный код и не смог правильно его отредактировать. Благодарю.
спасибо вам обоим .... это помогло :)