代码编织梦想

从零搭建pytorch模型教程(五)编写训练过程-爱代码爱编程

前言 本文介绍了训练日志的配置方法,为什么需要设置随机数种子,设置随机数种子的方法,加载数据的配置,学习的配置和调整方法,损失函数的配置和自定义损失函数的写法。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 训练日志的配置 训练日志是用于保存训练过程中的一些信息,方便事后查看模型的训练情

yolo系列梳理(九)初尝新鲜出炉的yolov6_yolov6 dataaug参数-爱代码爱编程

前言 近日,美团视觉智能部开源了YOLOv6的框架。YOLOv4、YOLOv5更多是注重于数据增强,而对网络结构的改动则比较少。和YOLOv4、YOLOv5不同,YOLOv6对网络结构的改动还是蛮大的。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 从YOLOv6的报告来看,它的性能也是再

attention mechanism in computer vision-爱代码爱编程

前言 本文系统全面地介绍了Attention机制的不同类别,介绍了每个类别的原理、优缺点。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 概述 Attention机制目的在于聚焦有用的信息,并减少不重要信息的比重。Attention机制可以分为6大类,包括4个基础类别和2个组合类别。

nms技术总结(nms原理、多类别nms、nms的缺陷、nms的改进思路、各种nms方法)-爱代码爱编程

前言  本文介绍了NMS的应用场合、基本原理、多类别NMS方法和实践代码、NMS的缺陷和改进思路、介绍了改进NMS的几种常用方法、提供了其它不常用的方法的链接。 本文很早以前发过,有个读者评论说没有介绍多类别NMS让他不满意,因此特来补充。顺便补充了NMS的缺点和改进思路。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟

cvpr 2022 | 网络中批处理归一化估计偏移的深入研究_cv技术指南(公众号)的博客-爱代码爱编程

前言 批归一化(BN)是深度学习中的一项重要技术。在训练过程中使用小批量统计量对激活进行规范化,而在推理过程中使用估计的总体统计量进行规范化。 本文主要研究总体统计量的估计问题。作者定义了BN的估计偏移幅度,以量化衡量其估计的种群统计数据与预期的差异。作者的主要观察是,由于网络中BN的叠加,估计偏移可能会累积,这对测试性能有不利影响。 进一步发

计算机视觉中的论文常见单词总结_cv技术指南(公众号)的博客-爱代码爱编程

前言 本文对计算机视觉论文中常出现的单词进行了汇总,对于不具备直接阅读英文文献的读者,可以考虑把这些单词给背了。 之前的文章《计算机视觉中的高效阅读论文的方法总结》中提到了如何掌握阅读英文文献的能力,我就是按照这个方法来做的,下面是我在执行过程中记录的单词。 差不多在背完这些单词后,我基本就没再用过翻译软件了,虽然看论文的过程中,仍然存在一些

神经网络各个部分的作用 & 彻底理解神经网络_cv技术指南(公众号)的博客-爱代码爱编程

这些题目来自知识星球【CV技术指南(免费版)】的日常作业 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 1. 神经网络的层数是如何数的? 我们说的网络越深,模型效果越好,指的是可训练参数越多,模型的特征提取能力或表示能力更好。 因此,神经网络的层数只与可训练参数的层数有关,层数等于卷

从零搭建pytorch模型教程(四)编写训练过程--参数解析_cv技术指南(公众号)的博客-爱代码爱编程

前言 训练过程主要是指编写train.py文件,其中包括参数的解析、训练日志的配置、设置随机数种子、classdataset的初始化、网络的初始化、学习率的设置、损失函数的设置、优化方式的设置、tensorboard的配置、训练过程的搭建等。 由于篇幅问题,这些内容将分成多篇文章来写。本文介绍参数解析的两种方式。 欢迎关注公众号CV技术指南,专

计算机视觉入门路线-爱代码爱编程

给大家写了一个计算机视觉入门路线,这个路线一共分为十一步,每一步指明了学习内容,学习程度,学习方式和学习目的,并指明了各个内容的重难点。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文主要介绍计算机视觉从入门到具备自主学习能力的一个学习路线。 在介绍具体内容前,有必要先说明现在计算机视觉的

从零搭建Pytorch模型教程(三)搭建Transformer网络-爱代码爱编程

前言 本文介绍了Transformer的基本流程,分块的两种实现方式,Position Emebdding的几种实现方式,Encoder的实现方式,最后分类的两种方式,以及最重要的数据格式的介绍。 本文来自公众号CV技术指南的技术总结系列 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

一份热力图可视化代码使用教程-爱代码爱编程

前言 特征图可视化与热力图可视化是论文中比较常用的两种可视化方法。上一篇文章《一份可视化特征图的代码》介绍了特征图可视化的代码,本篇将对如何进行热力图可视化做一个使用说明。 本文介绍了CAM、GradCAM的原理和缺陷,介绍了如何使用GradCAM算法实现热力图可视化,介绍了目标检测、语义分割、transformer模型等其它类型任务的热力图可视

从零搭建Pytorch模型教程(二)搭建网络-爱代码爱编程

前言  上一篇《从零搭建Pytorch模型教程(一)数据读取》中介绍了classdataset的几个要点,由哪些部分组成,每个部分需要完成哪些事情,如何进行数据增强,如何实现自己设计的数据增强。然后,介绍了分布式训练的数据加载方式,数据读取的整个流程,当面对超大数据集时,内存不足的改进思路。 本文介绍了如何搭建神经网络,构建网络的几种方式,前向传播的过

一份可视化特征图的代码-爱代码爱编程

前言 本文给大家分享一份我用的特征图可视化代码。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 写在前面的话 特征图可视化是很多论文所需要做的一份工作,其作用可以是用于证明方法的有效性,也可以是用来增加工作量,给论文凑字数。 具体来说就是可视化两个图,使用了新方法的和使用之前的

从零搭建Pytorch模型教程(一)数据读取-爱代码爱编程

前言  本文介绍了classdataset的几个要点,由哪些部分组成,每个部分需要完成哪些事情,如何进行数据增强,如何实现自己设计的数据增强。然后,介绍了分布式训练的数据加载方式,数据读取的整个流程,当面对超大数据集时,内存不足的改进思路。 本文延续了以往的写作态度和风格,即便是自己知道的内容,也仍然在写之前看了很多的文章来保证内容的正确性和

计算机视觉中的神经网络可视化工具与项目-爱代码爱编程

前言 本文介绍了一些关于神经网络可视化的项目,主要有CNN解释器,特征图、卷积核、类可视化的一些代码和项目,结构可视化工具,网络结构手动画图工具。 本文来自公众号CV技术指南的技术总结系列 关注公众号CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读 CNN解释器 这是一个中国博士发布的名叫CNN解释器的在线交

关于快速学习一项新技术或新领域的一些个人思维习惯与思想总结-爱代码爱编程

前言 本文尝试谈谈笔者对于学一项新技术、入门一个新领域的一些看法和方法。在本文会谈到一些思维习惯层面的、思想层面的内容,最后会给一个从零入门学习pytorch的方法作为例子。 写在前面的话 我写文章有一个特点,喜欢先把内容的重要性给写出来,读者才能明确为什么要看它,要怎样去看它。在我看来,这比正文更重要,也更难写好。 大学与中小学有着完

计算机视觉--CV技术指南文章汇总-爱代码爱编程

前言  本文汇总了过去本公众号原创的、国外博客翻译的、从其它公众号转载的、从知乎转载的等一些比较重要的文章,并按照论文分享、技术总结三个方面进行了一个简单分类。点击每篇文章标题可阅读详细内容 欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料

资源分享 | PyTea:不用运行代码,静态分析pytorch模型的错误-爱代码爱编程

前言  ​​​​​​​本文介绍一个Pytorch模型的静态分析器 PyTea,它不需要运行代码,即可在几秒钟之内扫描分析出模型中的张量形状错误。文末附使用方法。 本文转载自机器之心 编辑:CV技术指南 关注公众号CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 张量形状不匹配是深度神经网络机器学习过程中会出现的重要错误

计算机视觉中的transformer模型创新思路总结-爱代码爱编程

前言  本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。 本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别人发现问题并改进的思路,从而在自己方向上提出合适且合理的

2021-视频监控中的多目标跟踪综述-爱代码爱编程

本文来自一篇2021的论文,论文简要回顾了现有的SOTA模型和MOT算法、对多目标跟踪中的深度学习进行了讨论、介绍了评估方面的指标、数据集和基准结果,最后给出了结论。 本文来自公众号CV技术指南的技术总结系列 关注公众号CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 视频监控中的多目标跟踪(MTT)是一项重要而富有挑