目标检测经典作:有向目标检测方法oriented r-cnn-爱代码爱编程
来源:投稿 作者:摩卡
编辑:学姐
Motivation
由于当前的旋转目标检测模型(e.g., Rotated RPN, RoI Transformer)通过引入大量不同大小、角度的Anchors以此提升旋转目标检测的性能,或者是在生成水平Anchors的基础上进行RoI Alignment从而生成更精准的Oriented Anchors. 但是上述的这些方法在预测出更精细Oriented Anchors的同时也耗费了大量的计算资源。
为了提出一个优雅且高效的旋转目标检测框架,通过本文的调查,发现主要限制当前模型速度的阶段是候选框生成阶段,所以能否设计一个简单、通用的有向候选框生成方法,用于直接生成高质量候选框呢?
本文提出了一种有向目标检测方法 「Oriented R-CNN」。
Method
本文提出了一个两阶段的有向目标检测方法Oriented R-CNN。Oriented R-CNN由Oriented RPN (Oriented Region Proposal Network)和Oriented R-CNN Head构成。
首先通过Oriented RPN (Oriented Region Proposal Network)生成高质量有向候选框,然后通过Rotated RoIAlign提取固定大小尺寸的特征,最后将这些特征作为有向头检测的输入,执行分类和回归。网络框架图如下所示:
Oriented RPN是在RPN网络上构建的,拓展了RNP回归分支的输出维度(由原来的4个变为6个)以此来生成有向候选框。对于每个位置的Anchor, Oriented RPN输出为(x, y, w, h,Δα , Δβ), 其中(x, y)为有向候选框的中心坐标,w, h表示有向候选框的宽和高。
(Δα , Δβ ), 表示有向候选框外接矩形顶边和右边的偏移。接下来通过Midpoint Offset Representation得到有向候选框的顶点坐标集ν={ν1,ν2,ν3,ν4}。
这样就在原有水平候选框回归的基础上,回归任意两条相邻边中点的偏移,就能实现有向候选框的生成。结果如下图所示:
「Oriented R-CNN Head」: 在此阶段本文先进行候选框调整操作,将上述提到的有向候选框的顶点坐标集ν={ν1,ν2,ν3,ν4}由平行四边形转换为矩形(将平行四边形较长的对对角线作为调整为矩形的对角线)。
然后对所有调整后的后有向候选框进行rotated RoI alignment操作,将得到的特征图作为有向检测头的输入,执行分类和回归任务。
「Results」: Oriented R-CNN在DOTA和HRSC2016 两个数据集上进行验证。
表1:Oriented R-CNN在DOTA数据集的结果。‡表示使用多尺度训练多尺度测试。
表2:Oriented R-CNN在HRSC2016数据集的结果。
表3:Oriented R-CNN与其他有向目标检测方法在速度方面的对比(DOTA数据集)。
由上述实验结果可以看出Oriented R-CNN是一个提升有向目标检测效率的同时还兼顾检测精度的模型。
关注下方【学姐带你玩AI】🚀🚀🚀
回复“500”领取200+篇必读论文(含目标检测)
码字不易,欢迎大家点赞评论收藏!