代码编织梦想

七. 部署yolov8检测器-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 补充说明3. 代码分析3.1 main.cpp3.2 create_data.py 结语下载链接参考 前言 自动驾驶之心推出的 《CUDA

七. 部署yolov8检测器-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 补充说明3. 代码分析3.1 main.cpp3.2 trt_detector.hpp3.2 trt_detector.cpp 4. INT8量化前瞻总结下载链接

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 main函数2.2 build接口2.3 infer接口2.4 其他 总结参考 前言 自动驾驶之心推出的 《CUDA与Te

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 main.cpp2.2 model.cpp2.3 其它 总结下载链接参考 前言 自动驾驶之心推出的 《CUDA与Tenso

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 plugin_customScalar.py2.2 main.cpp2.3 model.cpp2.4 custom-scalar-plugin 3

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 main.cpp2.2 model.hpp2.3 model.cpp2.4 其它 总结下载链接参考 前言 自动驾驶之心推出

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 main.cpp2.2 model.cpp 3. 案例3.1 sample_conv3.2 sample_permute3.3 sample_re

五. tensorrt api的基本使用-爱代码爱编程

目录 前言0. 简述1. 案例运行2. 代码分析2.1 main.cpp2.2 model.cpp2.3 network.hpp 3. 案例3.1 sample_cbr3.2 sample_resBlo

cuda与tensorrt学习一:并行处理与gpu体系架构-爱代码爱编程

文章目录 一、并行处理简介1)串行介绍2)并行介绍3)并行与并发的区别4)编译器优化课程汇总5)常见并行处理 二、GPU并行处理1)基础概念介绍2)CPU和GPU在并行处理的优化方向3)CPU的特点及优

cuda编程-爱代码爱编程

GPU线程的理解 thread,block,grid 一、从 cpu 多线程角度理解 gpu 多线程1、cpu 多线程并行加速2、gpu多线程并行加速2.1、cpu 线程与 gpu 线程的理解(核函数)2.1.

模型部署 -爱代码爱编程

模型部署实践 - BevFusion 思路总结一、网络结构 - 总结1.1、代码1.2、网络流程图1.3、模块大致梳理 二、Onnx 的导出 -总体思路分析三、优化思路总结 学习 BevFusi

模型部署 -爱代码爱编程

onnx 注册自定义算子 第一步:手写一个算子,然后注册一下第二步:将算子放进模型定义第三步:利用 torch.onnx.export() 编写onnx 导出函数 一般我们自定义算子的时候,有以

模型部署 -爱代码爱编程

onnx 的导出和分析 一、PyTorch 导出 ONNX 的方法1.1、一个简单的例子 -- 将线性模型转成 onnx1.2、导出多个输出头的模型1.3、导出含有动态维度的模型 二、pytorch 导出

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. 什么是Implicit GEMM Conv2. Explicit GEMM Conv3. Implicit GEMM Conv4. Implicit GEMM Conv优化5. spc

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. 举例分析spconv的计算流程2. 导出带有spconv网络的onnx需要考虑的事情总结下载链接参考 前言 自动驾驶之心推出的 《CUDA与TensorRT部署

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. 什么是Explicit GEMM Conv2. im2col3. spconv是如何使用Explicit GEMM Conv的4. 使用Explicit GEMM Conv处理spco

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. 回顾一下RAII是什么2. 实现类,接口类与命名空间3. CUDA-BEVFusion设计框架(namespace)4. CUDA-BEVFusion设计框架(接口类)5. CUDA-

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. 使用spconv进行SCN的推理测试2. 导出onnx3. 补充-装饰器+钩子函数总结下载链接参考 前言 自动驾驶之心推出的 《CUDA与TensorRT部署实

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. camera.backbone.onnx(fp16)2. camera.backbone.onnx(int8)3. camera.vtransform.onnx(fp16)4. fus

八. 实战:cuda-爱代码爱编程

目录 前言0. 简述1. CUDA-BEVFusion浅析2. CUDA-BEVFusion环境配置2.1 简述2.2 源码下载2.3 模型数据下载2.4 基础软件安装2.5 protobuf安装2.5.1 a