代码编织梦想

clip-爱代码爱编程

摘要 https://arxiv.org/pdf/2403.09281v1 CLIP(Contrastive Language-Image Pretraining,对比语言-图像预训练)模型在识别问题中表现出了卓越的性能,

yolov9:使用可编程梯度信息学习您想学习的内容-爱代码爱编程

摘要 arxiv.org/pdf/2402.13616.pdf 当今的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果能最接近于实际结果。同时,还必须设计一个适当的架构,以便于获取足够的预测信息。现有的方法

基于深度学习的单图像人群计数研究:网络设计、损失函数和监控信号-爱代码爱编程

摘要 https://arxiv.org/pdf/2012.15685v2.pdf 单图像人群计数是一个具有挑战性的计算机视觉问题,在公共安全、城市规划、交通管理等领域有着广泛的应用。近年来,随着深度学习技术的发展,人群计

lska(大可分离核注意力):重新思考cnn大核注意力设计_lska模型-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、方法 4、实验 5、消融研究 6、与最先进方法的比较 7、ViTs和CNNs的鲁棒性评估基准比较 8、结论 摘要

作为工具制造者的大型语言模型_外部工具增强+llm-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、LLM as Tool Maker (LATM) 3.1、制作新工具并重用它们 3.2、用Dispatcher处理流数

【第15篇】transformer:attention is all you need-爱代码爱编程

文章目录 摘要 1、简介 2、背景 3、模型架构 3.1、编码器和解码器栈 3.2、注意力 3.2.1缩放点积注意力

vanillanet:极简主义在深度学习中的力量_vinalla 深度学习-爱代码爱编程

文章目录 摘要 1、简介 2、普通的神经网络架构 3、普通网络的训练 3.1、深度训练策略 3.2、串联的激活函数 4、实验

大型语言模型综述(二)_对准调谐包括指令调谐和对齐调谐,前者主要是为了增强(或解锁) llm的能力,是属于能-爱代码爱编程

文章目录 5 . LLMS自适应调优 5.1指令调优 5.1.1、格式化实例构造 5.1.2指令调优策略 5.1.3、指令调

swiftformer:基于transformer的高效加性注意力用于实时移动视觉应用的模型-爱代码爱编程

文章目录 摘要 1、简介 2、相关研究 3、方法 3.1、注意力模块概述 3.2、高效的加性注意力 3.3、SwiftFormer 架构 4

afpn:用于目标检测的渐近特征金字塔网络-爱代码爱编程

文章目录 摘要 1、介绍 2、相关工作 3、渐进特征金字塔网络 4、实验 5、结论 摘要 https://arxiv.org/pdf/2306.15988v1.pdf

efficientvit:高效视觉transformer与级联组注意力_静静ai学堂的博客-爱代码爱编程

文章目录 摘要 1、简介 2、用视觉transformer加速 2.1. 内存效率 2.2. 计算效率 2.3. 参数效率 3、高效视觉Tran

hic-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、方法 4、实验结果 5、结论 摘要 论文链接:https://arxiv.org/pdf/2309.16393.pdf 小目

lsknet:大选择核网络在遥感目标检测中的应用_静静ai学堂的博客-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 2.1、遥感目标检测框架 2.2、大核网络 2.3、注意力/选择机制 3、方法 3

小型目标检测中的transformer:一个基准和最先进技术的综述-爱代码爱编程

文章目录 摘要 1、简介 2、背景 3、基于transformer的小物体检测器 3.1、目标表示 3.2、针对高分辨率或多尺度特征图的高速注意力 3.3

超越自注意力:用于医学图像分割的可变形大核注意力-爱代码爱编程

文章目录 摘要 1、简介 2、方法 2.1、大核注意力(Large Kernel Attention) 2.2、可变形大核注意力 2.3、2D D-LKA网络

repvit:从vit视角重新审视移动cnn-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、方法论 3.1、初步 3.2、Block设计 3.3、宏观设计 3.4、微观设计 3.5、网络

fastvit:一种使用结构重新参数化的快速混合视觉变换器-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、体系结构 3.1、概述 3.2、FastViT 3.2.1、重新参数化跳过连接

kernelwarehouse:面向参数高效动态卷积-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 3、方法 3.1、KernelWarehouse的表述 3.2、KernelWarehouse的注意力模块

scconv:用于特征冗余的空间和通道重构卷积-爱代码爱编程

文章目录 摘要 1、简介 2、方法 2.1、SRU用于空间冗余 2.2. CRU用于通道冗余 2.3、复杂性分析 3、实验

inceptionnext:当inception遇到convnext-爱代码爱编程

文章目录 摘要 1、简介 2、相关工作 2.1、Transformer v.s.CNN 2.2、大核卷积。 3、方法 3.1、Me