Добавить CUDA в пакет ROS

0

Я хотел бы использовать cuda в пакете ros. У кого-нибудь простой пример для меня?

Я попытался построить статическую библиотеку с функцией cuda и добавить эту библиотеку в свой пакет, но у меня всегда возникает ошибка связывания: Неопределенная ссылка cuda...

Я создал исполняемый файл вместо библиотеки, и он работает.

Пожалуйста помоги!

  • 1
    это означает, что вам нужно связаться с библиотекой CUDA. если вы опубликуете конкретные шаги, которые вы сделали, и сообщения о компиляторе / компоновщике, люди смогут вам лучше помочь
Теги:
static-libraries
linker-errors
cuda
ros

1 ответ

4

Я нашел решение самостоятельно:

CMakeLists.txt:

cmake_minimum_required(VERSION 2.8.3)
PROJECT (beginner_tutorials)
FIND_PACKAGE(CUDA REQUIRED)

find_package(catkin REQUIRED COMPONENTS
  roscpp
  rospy
  std_msgs
)

SET(CUDA_NVCC_FLAGS "-arch=sm_13" CACHE STRING "nvcc flags" FORCE)
SET (CUDA_VERBOSE_BUILD ON CACHE BOOL "nvcc verbose" FORCE)
SET(LIB_TYPE STATIC) 
CUDA_ADD_LIBRARY(TestLib ${LIB_TYPE} src/helloWorld.cu)

catkin_package(
)
include_directories(
  ${catkin_INCLUDE_DIRS}
)

ADD_EXECUTABLE(beginner_tutorials_node src/main.cpp)
ADD_DEPENDENCIES(beginner_tutorials_node TestLib)
TARGET_LINK_LIBRARIES(beginner_tutorials_node
   ${catkin_LIBRARIES}
   ${PCL_LIBRARIES}
   TestLib
)

main.cpp:

int testmain();

int main()
{
testmain();
return 0;
}

helloWorld.cu:

#include <stdio.h>

#include <cuda.h>
#include <cuda_runtime.h>

const int N = 7;
const int blocksize = 7;

__global__
void hello(char *a, int *b)
{
  a[threadIdx.x] += b[threadIdx.x];
}

int testmain()
{
  char a[N] = "Hello ";
  int b[N] = {15, 10, 6, 0, -11, 1, 0};

  char *ad;
  int *bd;
  const int csize = N*sizeof(char);
  const int isize = N*sizeof(int);

  printf("%s", a);

  cudaMalloc( (void**)&ad, csize );
  cudaMalloc( (void**)&bd, isize );
  cudaMemcpy( ad, a, csize, cudaMemcpyHostToDevice );
  cudaMemcpy( bd, b, isize, cudaMemcpyHostToDevice );

  dim3 dimBlock( blocksize, 1 );
  dim3 dimGrid( 1, 1 );
  hello<<<dimGrid, dimBlock>>>(ad, bd);
  cudaMemcpy( a, ad, csize, cudaMemcpyDeviceToHost );
  cudaFree( ad );

  printf("%s\n", a);
  return EXIT_SUCCESS;
}
  • 0
    Для всех остальных, кто сталкивается с такой проблемой: он работает так же хорошо с общей библиотекой, просто замените

Ещё вопросы

Сообщество Overcoder
Наверх
Меню