вызов функции хоста из глобальной функции не допускается

0

Я компилирую проект cuda 5.5 на vs2010. Мне нужно использовать библиотеку mpir, потому что мой проект состоит из больших чисел. когда я использую mpir инструкции эта ошибка появляется. Я не знаю, как я могу это исправить. эта программа добавляет массив A и массив B, используя функции mpir.

 __global__
void vecAdd(mpz_t *A,mpz_t *B,mpz_t *C,int N)
{
    int i = threadIdx.x + blockDim.x * blockIdx.x;
    if(i<N)
    mpz_add(C[i],A[i],B[i]); 
}

int main()
{
    mpz_t *h_A;
    h_A=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_A[0],5,16);
    mpz_set_si(h_A[0],1);
    mpz_set_si(h_A[1],2);
    mpz_set_si(h_A[2],3);
    mpz_set_si(h_A[3],4);
    mpz_set_si(h_A[4],5);

    mpz_t *h_B;
    h_B=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_B[0],5,16);
    mpz_set_si(h_B[0],1);
    mpz_set_si(h_B[1],2);
    mpz_set_si(h_B[2],3);
    mpz_set_si(h_B[3],4);
    mpz_set_si(h_B[4],5);
    mpz_t *h_C;
    h_C=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_C[0],5,16);

    int N=5;
    int size=N*sizeof(mpz_t);

    mpz_t *d_A;
    d_A=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_A[0],5,16);

    mpz_t *d_B;
    d_B=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_B[0],5,16);

    mpz_t *d_C;
    d_C=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_C[0],5,16);

    cudaMalloc((void**)&d_A,size);
    cudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice);
    cudaMalloc((void**)&d_B,size);
    cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);
    cudaMalloc((void**)&d_C,size);

    vecAdd<<<ceil(N/512.0),512>>>(d_A,d_B,d_C,N);

    cudaMemcpy(h_C, d_C, size, cudaMemcpyDeviceToHost);

    cudaFree(d_A);  
    cudaFree(d_B);  
    cudaFree(d_C);

    for(int i=0;i<5;i++)
    {
       mpz_out_str(stdout,10,h_C[i]);
       printf("\n");
    }

    return 0;
}
  • 2
    Сделайте отступ в своем коде, пожалуйста.
  • 0
    @Angew Ангел О'кей, вспомнил это неправильно. Сожалею.
Показать ещё 1 комментарий
Теги:
cuda

1 ответ

2

Вы должны понимать, что функции, которые могут быть вызваны с устройства, должны быть скомпилированы в код устройства. Размещение __device__ в объявлении функции сделает его доступным со стороны устройства.

Однако, поскольку mpz_add из библиотеки MPIR, которая не была создана с функциями совместимости с CUDA (насколько мне известно), вам не повезло. Я предлагаю вам найти версию GPU произвольных чисел точности.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню