support tensorrt10 and remove old path operator by filesystem

9 months ago · c032958e7e
parent 66c1cd44b8
commit c032958e7e
7 changed files with 6365 additions and 79 deletions
--- a/csrc/detect/end2end/CMakeLists.txt
+++ b/csrc/detect/end2end/CMakeLists.txt
@ -1,4 +1,4 @@
-cmake_minimum_required(VERSION 3.1)
+cmake_minimum_required(VERSION 3.12)

 set(CMAKE_CUDA_ARCHITECTURES 60 61 62 70 72 75 86 89 90)
 set(CMAKE_CUDA_COMPILER /usr/local/cuda/bin/nvcc)
@ -10,34 +10,36 @@ set(CMAKE_CXX_STANDARD 14)
 set(CMAKE_BUILD_TYPE Release)
 option(CUDA_USE_STATIC_CUDA_RUNTIME OFF)

+list(APPEND CMAKE_MODULE_PATH "${CMAKE_CURRENT_SOURCE_DIR}/cmake")
+include(Function)
+
 # CUDA
 find_package(CUDA REQUIRED)
-message(STATUS "CUDA Libs: \n${CUDA_LIBRARIES}\n")
+print_var(CUDA_LIBRARIES)
+print_var(CUDA_INCLUDE_DIRS)
 get_filename_component(CUDA_LIB_DIR ${CUDA_LIBRARIES} DIRECTORY)
-message(STATUS "CUDA Headers: \n${CUDA_INCLUDE_DIRS}\n")
-message(STATUS "CUDA Lib Dir: \n${CUDA_LIB_DIR}\n")
+print_var(CUDA_LIB_DIR)

 # OpenCV
 find_package(OpenCV REQUIRED)
-message(STATUS "OpenCV Libs: \n${OpenCV_LIBS}\n")
-message(STATUS "OpenCV Libraries: \n${OpenCV_LIBRARIES}\n")
-message(STATUS "OpenCV Headers: \n${OpenCV_INCLUDE_DIRS}\n")
+print_var(OpenCV_LIBS)
+print_var(OpenCV_LIBRARIES)
+print_var(OpenCV_INCLUDE_DIRS)

 # TensorRT
-set(TensorRT_INCLUDE_DIRS /usr/include/x86_64-linux-gnu)
-list(APPEND TensorRT_LIBRARIES nvinfer nvinfer_plugin)
-set(TensorRT_LIB_DIR /usr/lib/x86_64-linux-gnu)
-
-
-message(STATUS "TensorRT Libs: \n${TensorRT_LIBRARIES}\n")
-message(STATUS "TensorRT Lib Dir: \n${TensorRT_LIB_DIR}\n")
-message(STATUS "TensorRT Headers: \n${TensorRT_INCLUDE_DIRS}\n")
+find_package(TensorRT REQUIRED)
+print_var(TensorRT_LIBRARIES)
+print_var(TensorRT_INCLUDE_DIRS)
+print_var(TensorRT_LIB_DIR)
+if (TensorRT_VERSION_MAJOR GREATER_EQUAL 10)
+    add_definitions(-DTRT_10)
+endif ()

 list(APPEND ALL_INCLUDE_DIRS
        ${CUDA_INCLUDE_DIRS}
        ${OpenCV_INCLUDE_DIRS}
        ${TensorRT_INCLUDE_DIRS}
-        include
+        ${CMAKE_CURRENT_SOURCE_DIR}/include
 )

 list(APPEND ALL_LIBS
@ -45,18 +47,38 @@ list(APPEND ALL_LIBS
        ${OpenCV_LIBRARIES}
        ${TensorRT_LIBRARIES}
 )
-message(STATUS "ALL_LIBS: \n${ALL_LIBS}\n")
+
 list(APPEND ALL_LIB_DIRS
        ${CUDA_LIB_DIR}
        ${TensorRT_LIB_DIR}
 )
-message(STATUS "ALL_LIB_DIRS: \n${ALL_LIB_DIRS}\n")
-add_executable(${PROJECT_NAME}
-        main.cpp
-        include/yolov8.hpp
-        include/common.hpp
+
+print_var(ALL_INCLUDE_DIRS)
+print_var(ALL_LIBS)
+print_var(ALL_LIB_DIRS)
+
+
+add_executable(
+        ${PROJECT_NAME}
+        ${CMAKE_CURRENT_SOURCE_DIR}/main.cpp
+        ${CMAKE_CURRENT_SOURCE_DIR}/include/yolov8.hpp
+        ${CMAKE_CURRENT_SOURCE_DIR}/include/common.hpp
+)
+
+target_include_directories(
+        ${PROJECT_NAME}
+        PUBLIC
+        ${ALL_INCLUDE_DIRS}
+)
+
+target_link_directories(
+        ${PROJECT_NAME}
+        PUBLIC
+        ${ALL_LIB_DIRS}
 )

-target_include_directories(${PROJECT_NAME} PUBLIC ${ALL_INCLUDE_DIRS})
-target_link_directories(${PROJECT_NAME} PUBLIC ${ALL_LIB_DIRS})
-target_link_libraries(${PROJECT_NAME} PRIVATE ${ALL_LIBS})
+target_link_libraries(
+        ${PROJECT_NAME}
+        PRIVATE
+        ${ALL_LIBS}
+)
--- a/csrc/detect/end2end/cmake/FindTensorRT.cmake
+++ b/csrc/detect/end2end/cmake/FindTensorRT.cmake
@ -0,0 +1,138 @@
+# This module defines the following variables:
+#
+# ::
+#
+#   TensorRT_INCLUDE_DIRS
+#   TensorRT_LIBRARIES
+#   TensorRT_FOUND
+#
+# ::
+#
+#   TensorRT_VERSION_STRING - version (x.y.z)
+#   TensorRT_VERSION_MAJOR  - major version (x)
+#   TensorRT_VERSION_MINOR  - minor version (y)
+#   TensorRT_VERSION_PATCH  - patch version (z)
+#
+# Hints
+# ^^^^^
+# A user may set ``TensorRT_ROOT`` to an installation root to tell this module where to look.
+#
+set(_TensorRT_SEARCHES)
+
+if(TensorRT_ROOT)
+    set(_TensorRT_SEARCH_ROOT PATHS ${TensorRT_ROOT} NO_DEFAULT_PATH)
+    list(APPEND _TensorRT_SEARCHES _TensorRT_SEARCH_ROOT)
+endif()
+
+# appends some common paths
+set(_TensorRT_SEARCH_NORMAL
+        PATHS "/usr"
+)
+list(APPEND _TensorRT_SEARCHES _TensorRT_SEARCH_NORMAL)
+
+# Include dir
+foreach(search ${_TensorRT_SEARCHES})
+    find_path(TensorRT_INCLUDE_DIR NAMES NvInfer.h ${${search}} PATH_SUFFIXES include)
+endforeach()
+
+if(NOT TensorRT_LIBRARY)
+    foreach(search ${_TensorRT_SEARCHES})
+        find_library(TensorRT_LIBRARY NAMES nvinfer ${${search}} PATH_SUFFIXES lib)
+        if(NOT TensorRT_LIB_DIR)
+            get_filename_component(TensorRT_LIB_DIR ${TensorRT_LIBRARY} DIRECTORY)
+        endif ()
+    endforeach()
+endif()
+
+if(NOT TensorRT_nvinfer_plugin_LIBRARY)
+    foreach(search ${_TensorRT_SEARCHES})
+        find_library(TensorRT_nvinfer_plugin_LIBRARY NAMES nvinfer_plugin ${${search}} PATH_SUFFIXES lib)
+    endforeach()
+endif()
+
+mark_as_advanced(TensorRT_INCLUDE_DIR)
+
+if(TensorRT_INCLUDE_DIR AND EXISTS "${TensorRT_INCLUDE_DIR}/NvInfer.h")
+    if(EXISTS "${TensorRT_INCLUDE_DIR}/NvInferVersion.h")
+        set(_VersionSearchFile "${TensorRT_INCLUDE_DIR}/NvInferVersion.h")
+    else ()
+        set(_VersionSearchFile "${TensorRT_INCLUDE_DIR}/NvInfer.h")
+    endif ()
+    file(STRINGS "${_VersionSearchFile}" TensorRT_MAJOR REGEX "^#define NV_TENSORRT_MAJOR [0-9]+.*$")
+    file(STRINGS "${_VersionSearchFile}" TensorRT_MINOR REGEX "^#define NV_TENSORRT_MINOR [0-9]+.*$")
+    file(STRINGS "${_VersionSearchFile}" TensorRT_PATCH REGEX "^#define NV_TENSORRT_PATCH [0-9]+.*$")
+
+    string(REGEX REPLACE "^#define NV_TENSORRT_MAJOR ([0-9]+).*$" "\\1" TensorRT_VERSION_MAJOR "${TensorRT_MAJOR}")
+    string(REGEX REPLACE "^#define NV_TENSORRT_MINOR ([0-9]+).*$" "\\1" TensorRT_VERSION_MINOR "${TensorRT_MINOR}")
+    string(REGEX REPLACE "^#define NV_TENSORRT_PATCH ([0-9]+).*$" "\\1" TensorRT_VERSION_PATCH "${TensorRT_PATCH}")
+    set(TensorRT_VERSION_STRING "${TensorRT_VERSION_MAJOR}.${TensorRT_VERSION_MINOR}.${TensorRT_VERSION_PATCH}")
+endif()
+
+include(FindPackageHandleStandardArgs)
+FIND_PACKAGE_HANDLE_STANDARD_ARGS(TensorRT REQUIRED_VARS TensorRT_LIBRARY TensorRT_INCLUDE_DIR VERSION_VAR TensorRT_VERSION_STRING)
+
+if(TensorRT_FOUND)
+    set(TensorRT_INCLUDE_DIRS ${TensorRT_INCLUDE_DIR})
+
+    if(NOT TensorRT_LIBRARIES)
+        set(TensorRT_LIBRARIES ${TensorRT_LIBRARY})
+        if (TensorRT_nvinfer_plugin_LIBRARY)
+            list(APPEND TensorRT_LIBRARIES ${TensorRT_nvinfer_plugin_LIBRARY})
+        endif()
+    endif()
+
+    if(NOT TARGET TensorRT::TensorRT)
+        add_library(TensorRT INTERFACE IMPORTED)
+        add_library(TensorRT::TensorRT ALIAS TensorRT)
+    endif()
+
+    if(NOT TARGET TensorRT::nvinfer)
+        add_library(TensorRT::nvinfer SHARED IMPORTED)
+        if (WIN32)
+            foreach(search ${_TensorRT_SEARCHES})
+                find_file(TensorRT_LIBRARY_DLL
+                        NAMES nvinfer.dll
+                        PATHS ${${search}}
+                        PATH_SUFFIXES bin
+                )
+            endforeach()
+
+            set_target_properties(TensorRT::nvinfer PROPERTIES
+                    INTERFACE_INCLUDE_DIRECTORIES "${TensorRT_INCLUDE_DIRS}"
+                    IMPORTED_LOCATION "${TensorRT_LIBRARY_DLL}"
+                    IMPORTED_IMPLIB "${TensorRT_LIBRARY}"
+            )
+        else()
+            set_target_properties(TensorRT::nvinfer PROPERTIES
+                    INTERFACE_INCLUDE_DIRECTORIES "${TensorRT_INCLUDE_DIRS}"
+                    IMPORTED_LOCATION "${TensorRT_LIBRARY}"
+            )
+        endif()
+        target_link_libraries(TensorRT INTERFACE TensorRT::nvinfer)
+    endif()
+
+    if(NOT TARGET TensorRT::nvinfer_plugin AND TensorRT_nvinfer_plugin_LIBRARY)
+        add_library(TensorRT::nvinfer_plugin SHARED IMPORTED)
+        if (WIN32)
+            foreach(search ${_TensorRT_SEARCHES})
+                find_file(TensorRT_nvinfer_plugin_LIBRARY_DLL
+                        NAMES nvinfer_plugin.dll
+                        PATHS ${${search}}
+                        PATH_SUFFIXES bin
+                )
+            endforeach()
+
+            set_target_properties(TensorRT::nvinfer_plugin PROPERTIES
+                    INTERFACE_INCLUDE_DIRECTORIES "${TensorRT_INCLUDE_DIRS}"
+                    IMPORTED_LOCATION "${TensorRT_nvinfer_plugin_LIBRARY_DLL}"
+                    IMPORTED_IMPLIB "${TensorRT_nvinfer_plugin_LIBRARY}"
+            )
+        else()
+            set_target_properties(TensorRT::nvinfer_plugin PROPERTIES
+                    INTERFACE_INCLUDE_DIRECTORIES "${TensorRT_INCLUDE_DIRS}"
+                    IMPORTED_LOCATION "${TensorRT_nvinfer_plugin_LIBRARY}"
+            )
+        endif()
+        target_link_libraries(TensorRT INTERFACE TensorRT::nvinfer_plugin)
+    endif()
+endif()
--- a/csrc/detect/end2end/cmake/Function.cmake
+++ b/csrc/detect/end2end/cmake/Function.cmake
@ -0,0 +1,14 @@
+
+function(print_var var)
+    set(value "${${var}}")
+    string(LENGTH "${value}" value_length)
+    if(value_length GREATER 0)
+        math(EXPR last_index "${value_length} - 1")
+        string(SUBSTRING "${value}" ${last_index} ${last_index} last_char)
+    endif()
+
+    if(NOT "${last_char}" STREQUAL "\n")
+        set(value "${value}\n")
+    endif()
+    message(STATUS "${var}:\n   ${value}")
+endfunction()
--- a/csrc/detect/end2end/include/common.hpp
+++ b/csrc/detect/end2end/include/common.hpp
@ -5,6 +5,7 @@
 #ifndef DETECT_END2END_COMMON_HPP
 #define DETECT_END2END_COMMON_HPP
 #include "NvInfer.h"
+#include "filesystem.hpp"
 #include "opencv2/opencv.hpp"
 #include <sys/stat.h>
 #include <unistd.h>
@ -89,33 +90,6 @@ inline static float clamp(float val, float min, float max)
    return val > min ? (val < max ? val : max) : min;
 }

-inline bool IsPathExist(const std::string& path)
-{
-    if (access(path.c_str(), 0) == F_OK) {
-        return true;
-    }
-    return false;
-}
-
-inline bool IsFile(const std::string& path)
-{
-    if (!IsPathExist(path)) {
-        printf("%s:%d %s not exist\n", __FILE__, __LINE__, path.c_str());
-        return false;
-    }
-    struct stat buffer;
-    return (stat(path.c_str(), &buffer) == 0 && S_ISREG(buffer.st_mode));
-}
-
-inline bool IsFolder(const std::string& path)
-{
-    if (!IsPathExist(path)) {
-        return false;
-    }
-    struct stat buffer;
-    return (stat(path.c_str(), &buffer) == 0 && S_ISDIR(buffer.st_mode));
-}
-
 namespace det {
 struct Binding {
    size_t         size  = 1;
--- a/csrc/detect/end2end/include/filesystem.hpp
+++ b/csrc/detect/end2end/include/filesystem.hpp
--- a/csrc/detect/end2end/include/yolov8.hpp
+++ b/csrc/detect/end2end/include/yolov8.hpp
@ -64,28 +64,51 @@ YOLOv8::YOLOv8(const std::string& engine_file_path)

    assert(this->context != nullptr);
    cudaStreamCreate(&this->stream);
-    this->num_bindings = this->engine->getNbBindings();
+
+#ifdef TRT_10
+    this->num_bindings = this->engine->getNbIOTensors();
+#else
+    this->num_bindings = this->num_bindings = this->engine->getNbBindings();
+#endif

    for (int i = 0; i < this->num_bindings; ++i) {
-        Binding            binding;
-        nvinfer1::Dims     dims;
+        Binding        binding;
+        nvinfer1::Dims dims;
+#ifdef TRT_10
+        std::string        name  = this->engine->getIOTensorName(i);
+        nvinfer1::DataType dtype = this->engine->getTensorDataType(name.c_str());
+#else
        nvinfer1::DataType dtype = this->engine->getBindingDataType(i);
        std::string        name  = this->engine->getBindingName(i);
-        binding.name             = name;
-        binding.dsize            = type_to_size(dtype);
-
+#endif
+        binding.name  = name;
+        binding.dsize = type_to_size(dtype);
+#ifdef TRT_10
+        bool IsInput = engine->getTensorIOMode(name.c_str()) == nvinfer1::TensorIOMode::kINPUT;
+#else
        bool IsInput = engine->bindingIsInput(i);
+#endif
        if (IsInput) {
            this->num_inputs += 1;
-            dims         = this->engine->getProfileDimensions(i, 0, nvinfer1::OptProfileSelector::kMAX);
+#ifdef TRT_10
+            dims = this->engine->getProfileShape(name.c_str(), 0, nvinfer1::OptProfileSelector::kMAX);
+            // set max opt shape
+            this->context->setInputShape(name.c_str(), dims);
+#else
+            dims = this->engine->getProfileDimensions(i, 0, nvinfer1::OptProfileSelector::kMAX);
+            // set max opt shape
+            this->context->setBindingDimensions(i, dims);
+#endif
            binding.size = get_size_by_dims(dims);
            binding.dims = dims;
            this->input_bindings.push_back(binding);
-            // set max opt shape
-            this->context->setBindingDimensions(i, dims);
        }
        else {
-            dims         = this->context->getBindingDimensions(i);
+#ifdef TRT_10
+            dims = this->context->getTensorShape(name.c_str());
+#else
+            dims = this->context->getBindingDimensions(i);
+#endif
            binding.size = get_size_by_dims(dims);
            binding.dims = dims;
            this->output_bindings.push_back(binding);
@ -96,9 +119,15 @@ YOLOv8::YOLOv8(const std::string& engine_file_path)

 YOLOv8::~YOLOv8()
 {
+#ifdef TRT_10
+    delete this->context;
+    delete this->engine;
+    delete this->runtime;
+#else
    this->context->destroy();
    this->engine->destroy();
    this->runtime->destroy();
+#endif
    cudaStreamDestroy(this->stream);
    for (auto& ptr : this->device_ptrs) {
        CHECK(cudaFree(ptr));
@ -115,15 +144,27 @@ void YOLOv8::make_pipe(bool warmup)
        void* d_ptr;
        CHECK(cudaMallocAsync(&d_ptr, bindings.size * bindings.dsize, this->stream));
        this->device_ptrs.push_back(d_ptr);
+
+#ifdef TRT_10
+        auto name = bindings.name.c_str();
+        this->context->setInputShape(name, bindings.dims);
+        this->context->setTensorAddress(name, d_ptr);
+#endif
    }

    for (auto& bindings : this->output_bindings) {
-        void * d_ptr, *h_ptr;
+        void *d_ptr, *h_ptr;
+
        size_t size = bindings.size * bindings.dsize;
        CHECK(cudaMallocAsync(&d_ptr, size, this->stream));
        CHECK(cudaHostAlloc(&h_ptr, size, 0));
        this->device_ptrs.push_back(d_ptr);
        this->host_ptrs.push_back(h_ptr);
+
+#ifdef TRT_10
+        auto name = bindings.name.c_str();
+        this->context->setTensorAddress(name, d_ptr);
+#endif
    }

    if (warmup) {
@ -202,25 +243,42 @@ void YOLOv8::copy_from_Mat(const cv::Mat& image)
    cv::Size size{width, height};
    this->letterbox(image, nchw, size);

-    this->context->setBindingDimensions(0, nvinfer1::Dims{4, {1, 3, height, width}});
-
    CHECK(cudaMemcpyAsync(
        this->device_ptrs[0], nchw.ptr<float>(), nchw.total() * nchw.elemSize(), cudaMemcpyHostToDevice, this->stream));
+
+#ifdef TRT_10
+    auto name = this->input_bindings[0].name.c_str();
+    this->context->setInputShape(name, nvinfer1::Dims{4, {1, 3, size.height, size.width}});
+    this->context->setTensorAddress(name, this->device_ptrs[0]);
+#else
+    this->context->setBindingDimensions(0, nvinfer1::Dims{4, {1, 3, height, width}});
+#endif
 }

 void YOLOv8::copy_from_Mat(const cv::Mat& image, cv::Size& size)
 {
    cv::Mat nchw;
    this->letterbox(image, nchw, size);
-    this->context->setBindingDimensions(0, nvinfer1::Dims{4, {1, 3, size.height, size.width}});
+
    CHECK(cudaMemcpyAsync(
        this->device_ptrs[0], nchw.ptr<float>(), nchw.total() * nchw.elemSize(), cudaMemcpyHostToDevice, this->stream));
+
+#ifdef TRT_10
+    auto name = this->input_bindings[0].name.c_str();
+    this->context->setInputShape(name, nvinfer1::Dims{4, {1, 3, size.height, size.width}});
+    this->context->setTensorAddress(name, this->device_ptrs[0]);
+#else
+    this->context->setBindingDimensions(0, nvinfer1::Dims{4, {1, 3, size.height, size.width}});
+#endif
 }

 void YOLOv8::infer()
 {
-
+#ifdef TRT_10
+    this->context->enqueueV3(this->stream);
+#else
    this->context->enqueueV2(this->device_ptrs.data(), this->stream, nullptr);
+#endif
    for (int i = 0; i < this->num_outputs; i++) {
        size_t osize = this->output_bindings[i].size * this->output_bindings[i].dsize;
        CHECK(cudaMemcpyAsync(
--- a/csrc/detect/end2end/main.cpp
+++ b/csrc/detect/end2end/main.cpp
@ -5,6 +5,8 @@
 #include "opencv2/opencv.hpp"
 #include "yolov8.hpp"

+namespace fs = ghc::filesystem;
+
 const std::vector<std::string> CLASS_NAMES = {
    "person",         "bicycle",    "car",           "motorcycle",    "airplane",     "bus",           "train",
    "truck",          "boat",       "traffic light", "fire hydrant",  "stop sign",    "parking meter", "bench",
@ -37,27 +39,30 @@ const std::vector<std::vector<unsigned int>> COLORS = {

 int main(int argc, char** argv)
 {
+    if (argc != 3) {
+        fprintf(stderr, "Usage: %s [engine_path] [image_path/image_dir/video_path]\n", argv[0]);
+        return -1;
+    }
+
    // cuda:0
    cudaSetDevice(0);

    const std::string engine_file_path{argv[1]};
-    const std::string path{argv[2]};
+    const fs::path    path{argv[2]};

    std::vector<std::string> imagePathList;
    bool                     isVideo{false};

-    assert(argc == 3);
-
    auto yolov8 = new YOLOv8(engine_file_path);
    yolov8->make_pipe(true);

-    if (IsFile(path)) {
-        std::string suffix = path.substr(path.find_last_of('.') + 1);
-        if (suffix == "jpg" || suffix == "jpeg" || suffix == "png") {
+    if (fs::exists(path)) {
+        std::string suffix = path.extension();
+        if (suffix == ".jpg" || suffix == ".jpeg" || suffix == ".png") {
            imagePathList.push_back(path);
        }
-        else if (suffix == "mp4" || suffix == "avi" || suffix == "m4v" || suffix == "mpeg" || suffix == "mov"
-                 || suffix == "mkv") {
+        else if (suffix == ".mp4" || suffix == ".avi" || suffix == ".m4v" || suffix == ".mpeg" || suffix == ".mov"
+                 || suffix == ".mkv") {
            isVideo = true;
        }
        else {
@ -65,8 +70,8 @@ int main(int argc, char** argv)
            std::abort();
        }
    }
-    else if (IsFolder(path)) {
-        cv::glob(path + "/*.jpg", imagePathList);
+    else if (fs::is_directory(path)) {
+        cv::glob(path.string() + "/*.jpg", imagePathList);
    }

    cv::Mat             res, image;
@ -99,9 +104,9 @@ int main(int argc, char** argv)
        }
    }
    else {
-        for (auto& path : imagePathList) {
+        for (auto& p : imagePathList) {
            objs.clear();
-            image = cv::imread(path);
+            image = cv::imread(p);
            yolov8->copy_from_Mat(image, size);
            auto start = std::chrono::system_clock::now();
            yolov8->infer();