代码编织梦想

论文阅读:pidnet: a real-time semantic segmentation network inspired by pidcontrollers-爱代码爱编程

来源:2023CVPR 原文链接:https://arxiv.org/abs/2206.02066 源码:GitHub - XuJiacong/PIDNet: This is the official repository for our recent work: PIDNet 0、摘要         双分支网络结构在实时语义分割任务中显示了其有

论文阅读:cylindrical and asymmetrical 3d convolution networksfor lidar segmentation-爱代码爱编程

题目:用于激光雷达分割的圆柱形和非对称三维卷积网络 来源CVPR 2021 开源链接: https://github.com/xinge008/Cylinder3D 0、摘要 用于大规模行车场景分割的最先进的方法通常是将点云投影到二维空间,然后通过二维卷积进行处理。虽然这种方法在点云领域表现出了竞争力,但不可避免地改变和放弃了三维拓扑和几何关系

d模板成员语义分析中的顺序依赖-爱代码爱编程

原文 template isCallable(alias callable) { static if (is(typeof(&callable!()))) enum bool isCalla

带你读ai论文丨针对文字识别的多模态半监督方法-爱代码爱编程

摘要:本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。 本文分享自华为云社区《一种针对文字识别的多模态半监督方法》,作者: Hint 。 摘要 直到最近,公开的真实场景文本图像的数量仍然不足以训练场景文本识别

论文阅读:lasernet++:sensor fusion for joint 3d object detection and semantic segmentation-爱代码爱编程

题目:Sensor Fusion for Joint 3D Object Detection and Semantic Segmentation 翻译:用于联合 3D 对象检测和语义分割的传感器融合 来源:2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition Worksh

论文阅读:pointnet++: deep hierarchical feature learning onpoint sets in a metric space-爱代码爱编程

原文连接:https://arxiv.org/pdf/1706.02413.pdf 题目:PointNet++:度量空间中点集的深度层次特征学习 来源:NISP 2017 Pointnet 的改进版本,(1)利用层次化信息获取局部信息(2)自适应密度的特征提取方法 0、摘要         很少有以前的工作研究点集的深度学习。 PointNet

论文阅读:pointnet: deep learning on point sets for 3d classification and segmentation-爱代码爱编程

原文链接:https://arxiv.org/abs/1612.00593 题目:PointNet:用于3D分类和分割的点集深度学习 来源:cvpr 2017 0、摘要         点云是一类重要的几何数据结构。由于其格式不规则,大多数研究人员将此类数据转换为规则的 3D 体素网格或图像集合。然而,这会使数据不必要地庞大并导致问题。在本文中,我

论文阅读:lif-seg: lidar and camera image fusion for 3dlidar semantic segmentation_shiyueyueya的博客-爱代码爱编程

LIF-Seg:用于 3D LiDAR 语义分割的 LiDAR 和相机图像融合 来源:华科 + 商汤 未发表2021 链接:https://arxiv.org/abs/2108.07511 个人觉得有用的和自己理解加粗和()内表示,尽量翻译的比较全,有一些官方话就没有翻译了,一些疑惑的地方欢迎大家探讨。如果对整个领域比较熟悉看一、三两章就可以了 0

论文阅读:semantickitti: a dataset for semantic scene understandingof lidar sequences_shiyueyueya的博客-爱代码爱编程

题目:SemanticKITTI: A Dataset for Semantic Scene Understanding of LiDAR Sequences 这篇文章主要是发布数据集SemanticKITTI 没太大难度直接看看就好 ICCV2019 数据集官网:SemanticKITTI - A Dataset for LiDAR-based Se

论文阅读:deformable detr:deformable detr: deformable transformersfor end-to-end object detection_shiyueyueya的博客-爱代码爱编程

题目:DEFORMABLE DETR:DEFORMABLE DETR: DEFORMABLE TRANSFORMERSFOR END-TO-END OBJECT DETECTION 来源:ICLA 是针对Detr 的改进 原文:https://arxiv.org/pdf/2010.04159.pdf 个人觉得有用的和自己理解加粗和()内表示,尽量翻译

论文阅读:visual semantic localization based on hd map for autonomousvehicles in urban scenarios_shiyueyueya的博客-爱代码爱编程

题目:Visual Semantic Localization based on HD Map for Autonomous Vehicles in Urban Scenarios 中文:基于高清地图的城市场景自动驾驶车辆视觉语义定位 来源: ICRA 2021 链接:https://ieeexplore.ieee.org/document/9561

论文阅读:roadmap: a light-weight semantic map for visual localizationtowards autonomous driving轻量语义自动驾驶_shiyueyueya的博客-爱代码爱编程

题目:A Light-Weight Semantic Map for Visual Localization towards Autonomous Driving 中文:用于自动驾驶的视觉定位的轻量级语义图 来源: ICRA 2021 链接:https://arxiv.org/abs/2106.02527 可以去看下作者秦通(华为天才少年年薪200

阅读笔记2dpass: 2d priors assisted semanticsegmentation on lidar point clouds lidar_shiyueyueya的博客-爱代码爱编程

题目:2DPASS: 2D Priors Assisted SemanticSegmentation on LiDAR Point Clouds ECCV 2022。建议打开csdn右侧目录栏,部分个人理解和觉得重要内容有加粗表示,其余内容主要是机器翻译。如果对整个领域比较熟悉直接从第三章开始看就行。 主要贡献:2D先验辅助语义分割 (2DPASS)+

deep learning for image and point cloud fusion in autonomous driving: a review 综述 自动驾驶中图像和点云融合的深度学习_shiyueyueya的博客-爱代码爱编程

题目:Deep Learning for Image and Point Cloud Fusionin Autonomous Driving: A Review  原文连接:Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review | IEEE Journ

deeplabv1:semantic image segmentation with deep convolutional nets and fully connected crfs_shiyueyueya的博客-爱代码爱编程

目录 摘要 目前存在问题 解决方案 1、采用空洞卷积,在感受视野不变的情况,降低了参数量,保证了运行速度。 2、引入CRF处理,在深度网络之后添加全连接的CRF 网络结构 实验结果: 创新点: 参考链接: 摘要 领域:语义分割 数据集:PASCAL VOC-2012 性能:IOU 71.6% 目前存在问题 1、DCNN下

ultra fast structure-aware deep lane detection日常读论文_shiyueyueya的博客-爱代码爱编程

语义中的车道线检测,车道线检测主要两大类,一类传统方法,一类深度学习方法,深度学习中SCNN卷积 SAD自注意力蒸馏。 作者主要解决两个问题: 1、How the formulation achieves fast speed   速度问题 2、How the formulation handles the no-visual-clue problem

一三三、车载语音方案梳理与优化-爱代码爱编程

优化点: 1. 防抖 // 当观察到变动时执行的回调函数 const callback = debounce(mutationsList => { if (!this.lifeCycle.disposed &&

【文献翻译】BERT-Based Named Entity Recognition in Chinese Twenty-Four Histories-爱代码爱编程

中国二十四史中基于BERT的命名实体识别 摘要 文言命名实体识别在提高文言文信息抽取能力和知识图谱构建能力方面发挥着基础性作用。然而,由于缺乏注释数据和语法规则的复杂性,文言命名实体识别进展甚微。为了解决标注数据不足的问题,我们提出了一种不基于领域知识的端到端解决方案,而是基于预训练的 BERT-Chinese 模型并集成 BiLSTM-CRF 模型文

带你读AI论文:SDMG-R结构化提取—无限版式小票场景应用-爱代码爱编程

摘要:在文档图像中提取关键信息在自动化办公应用中至关重要。传统基于模板匹配或者规则的方法,在通用性方面、未见过版式模板数据方面,效果都不好;为此,本文提出了一种端到端的空间多模态图推理模型(SDMG-R),能有效的从未见过的模板数据中提取关键信息,并且通用性更好。 本文分享自华为云社区《论文解读系列十二:SDMG-R结构化提取—无限版式小票场景应用

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR-爱代码爱编程

摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。 本文分享自华为云社区《论文解读系列十八:融合视觉、语义、关系多模态信息的文档版面分析架构VSR》,作者: 小菜鸟chg 。 现有文档版面分析方法大致可分为两种:基于NLP的方