代码编织梦想

NMS(非极大值抑制)总结-爱代码爱编程

本文来源于公众号《CV技术指南》的技术总结部分,更多相关技术总结请扫描文末二维码关注公众号。 导言:     Non-Maximum Suppression(NMS)非极大值抑制,也有个别地方称之为非最大值抑制。个人认为前者更为贴切,因为其具体实现原理是找到所有局部最大值,并抑制非局部最大值,而不是找全局最大值,后文会介绍代码。从字面意思理解,抑制那些

《图解深度学习》学习笔记(六)-爱代码爱编程

第七章 深度学习工具 1、Theano 在学习Theano时,我们必须了解共享变量的概念。由于函数的输入和输出是Python的Numpy数组,所以每次调用这些函数时,GPU都需要将其复制到内存里。如果使用共享变量,GPU就可以从共享变量中获取数据,无须每次都将数据复制到内存里。通过使用共享变量,使用误差反向传播算法等梯度下降法估计参数时,就无须每次

利用open-cv对黄晓明、AB、刘亦菲图片进行人脸识别-爱代码爱编程

利用open-cv对黄晓明、AB、刘亦菲图片进行人脸识别 1. 简单的小示例2 项目所需材料及业务逻辑3 人脸检测并截取图片保存在本地4 制作标签5 训练模型6 模型测试总结 手动反爬虫: 原博地址 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息 如若转载,请标明出处,谢谢

机械臂论文笔记(五)【2020抓取检测】机器人目标抓取区域实时检测方法 卢智亮-爱代码爱编程

论文下载 摘 要 摘 要:针对目前机器人目标抓取区域检测方法无法兼顾检测准确率和实时性的问题,提出一种基于 SE-Retina Grasp神经网络模型的机器人目标抓取区域实时检测方法。该方法首先以一阶目标检测模型RetinaNet为基础提取抓取框位置及抓取角度;针对抓取检测任务采用 SENet结构确定重要的特征通道;结合平衡特征金字塔设计思想,充分融合

paperreading:《End-to-End Object Detection with Transformers》-爱代码爱编程

论文链接:https://arxiv.org/pdf/2005.12872.pdf.ECCV 2020 1 Background 目标检测的目标是对每个感兴趣的目标去预测一组bounding boxes和类别标签。 现代检测器以一种间接的方式来解决集预测任务,通过在一些prosoals、anchors或者中心点上定义替代回归和分类问题。他们的性能很明

一文读懂图像数据的标准化与归一化-爱代码爱编程

深度学习训练-详解图像数据标准化与归一化 使用深度学习在进行图像分类或者对象检测时候,首先需要对图像做数据预处理,最常见的对图像预处理方法有两种,正常白化处理又叫图像标准化处理,另外一种方法叫做归一化处理,下面就详细的说一下这两种处理方法。 一:图像标准化处理 标准化处理的公式如下:tensorflow中对图像标准化预处理的API函数如下: tf.

论文笔记:Dense Contrastive Learning for Self-Supervised Visual Pre-Training-爱代码爱编程

论文笔记:Dense Contrastive Learning for Self-Supervised Visual Pre-Training ABSTRACT: 背景:主流的自监督模型都被设计和优化image classification。 但是预训练模型用于预测dense predication task的优化做的不太好,这是由于在image le

论文笔记——Sparse R-CNN-爱代码爱编程

论文下载: https://msc.berkeley.edu/research/autonomous-vehicle/sparse_rcnn.pdf 论文代码: https://github.com/PeizeSun/SparseR-CNN 论文摘要: 提出一种纯稀疏(purely sparse)的图像目标检测方法,从图像

端到端场景文本检测识别:Character Region Attention For Text Spotting-爱代码爱编程

基于CRAFT改进,提出的字符得分图有助于识别器更好地关注字符中心点,并且识别损失向检测器模块的传播会增强字符区域的定位。 ECCV2020 论文地址:https://arxiv.org/pdf/2007.09629 1. 总述 典型的场景文字检测识别分为检测和识别模块两个单独的分支,并且通常使用RoI Pooling来让这两个分支共享视觉特

papperreading:《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》-爱代码爱编程

论文链接:https://arxiv.org/pdf/2011.12450.pdf.arxiv 2020 文章目录 1 Background2 Motivation3 Related Work4 Advantages/Contributions5 Method5.1.Pipeline5.2.Module6 Experiments6.1.Dataset

图卷积网络在文本和视频的关系对齐中的应用-爱代码爱编程

1.写在前面 原文来自知网《基于视觉-文本关系对齐的跨模态视频片段检索》 这是一篇关于利用文本进行视频片段检索的论文。 2.论文要点 论文总结了前人研究工作的缺点,并借助图结构在表达关系时的强大能力与图卷积网络的近年发展,,提出了跨模态关系对齐的图卷积框架 CrossGraphAlign, 具体就是CrossGraphAlign首先为查询文本和待检

MATLAB boundarymask函数(查找分割的区域边界)-爱代码爱编程

文章目录 语法说明示例输入参数输出参数 语法 mask = boundarymask(L) mask = boundarymask(BW) mask = boundarymask(___,conn) 说明 mask = boundarymask(L) %计算代表输入标签矩阵L的区域边界的掩码。 %输出mask是逻辑图像,在边界位置为tr

胶囊神经网络资源转载和Pytorch实现-爱代码爱编程

胶囊神经网络资源转载和Pytorch实现 胶囊神经网络的简介, 介绍了CNN的缺点以及为啥么出现胶囊神经网络胶囊神经网络原理,用图像讲解胶囊神经网络原理,有代码实现,但有些错误胶囊神经网络动态路由算法胶囊神经网络Pytorch高赞实现, githubgithub那个代码是pytorch0.4之前才能用,所以这里附上博主pytorch1.6写的关键部分实现

基于结构光的2D深度边缘检测-爱代码爱编程

Structured Light Based Depth Edge Detection for Object Shape Recovery 文章总结 比较经典的一篇2D depth edge detection的文章,2005年CVPR 文章大意:现有的Canny边缘提取算法,无法区分texture edge and depth edge, 然后作者结

KinectFusion: Real-Time Dense Surface Mapping and Tracking 论文解析-爱代码爱编程

1. 概述 Kinect Fusion 是第一个系统利用RGBD相机在房间大小的范围实现具有 real-time, dense volumetric reconstruction特性的三维重建。并且因为具有稠密的深度信息,所以在黑暗的情况下,也可以实现三维重建。本文的创新点是用了tracking的方法来吧整个地图的surface model进行了融合,而

图像配准的前世今生:从人工设计特征到深度学习-爱代码爱编程

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达 机器之心编译 参与:Nurhachu Null,Geek AI 作者:Emma Kamoun 作为计算机视觉的重要研究课题,图像配准经历了从传统方法走向深度学习的重要革命。本文将回顾图像配准技术的前世今生,为读者提供一个该领域的宏观视野。 图像配准是计算机

中文NER的正确打开方式: 词汇增强方法总结 (从Lattice LSTM到FLAT)-爱代码爱编程

点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要21分钟 跟随小博主,每天进步一丢丢 来源:知乎    作者:JayLou娄杰 编辑:深度学习自然语言处理 链接:见文末阅读原文 本文仅做学术分享,侵删 众所周知,与英文NER相比,中文NER通常采取基于字符的方式。究其缘由,由于中文分词存在误差,基于字符的NER

重磅!腾讯优图11篇论文入选AI顶会AAAI 2021-爱代码爱编程

点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 本文转载自:腾讯优图 近日,国际人工智能顶级会议AAAI 2021公布了论文录取结果。AAAI是人工智能领域最悠久、涵盖内容最为广泛的国际顶级学术会议之一。AAAI 2021一共收到9034篇论文提交,其中有效审稿的数量为79

自动驾驶中车辆的如何使用点云定位?-爱代码爱编程

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 标题:Review on 3D Lidar Localization for Autonomous Driving Cars 作者:Mahdi Elhousni and Xinming Huang 翻译:particle 欢迎各位加入免费知识星球,获取PDF文档,欢迎转发朋友圈,

训练数据严重不足,我的GAN也不会凉凉了!-爱代码爱编程

点击上方“机器学习与生成对抗网络”,关注"星标"获取有趣、好玩的前沿干货! 来源 | venturebeat 报道  | 新智元   编辑 | 科雨 【导读】Nivida最新力作将于NeurlPS2020露面,强大的ADA模型可大幅降低GAN的训练数据要求,仅靠千张图片,即可训练出强大的GAN网络,下面我们就来一探究竟。  我们大家都知道,