计算机视觉 | 爱代码爱编程

什么是智能体(agent)_agent智能体-爱代码爱编程

2024-03-20 分类: 人工智能深度学习 python Pytorch 计算机视觉

智能体（Agent）是人工智能领域中的一个核心概念。在最基本的层面上，智能体可以被定义为一个实体，它能够在其所处的环境中自主地感知信息，并根据这些信息做出决策，以实现特定的目标或任务。智能体的关键特性包括自主性、感知能力和决

论文解读：(coop)learning to prompt for vision-爱代码爱编程

2024-04-17 分类: 人工智能深度学习计算机视觉 prompt 少样本图像分类

文章汇总存在的问题虽然训练类别通常具有文本形式，例如“金鱼”或“卫生纸”，但它们将被转换为离散标签，只是为了简化交叉熵损失的计算，从而使文本中的语义封装在很大程度上未被利用。这样的学习范式将视觉识别系统限制在闭集视觉概念，使它们无法处理新的类别，因为学习新的分类器需要额外的数据。动机即使之前的学者进行了广泛的调优，也不能保证生成的提示对于这

无需额外知识或训练！中科大等提出opera：缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法...-爱代码爱编程

2023-12-08 分类: 人工智能深度学习计算机视觉

点击下方卡片，关注“CVer”公众号 AI/CV重磅干货，第一时间送达点击进入—>【多模态学习】微信交流群扫码加入CVer知识星球，可以最快学习到最新顶会顶刊上的论文idea和CV从入门到精通资料，以及最前沿项目和应用！发论文，强烈推荐！在CVer微信公众号后台回复：OPERA，即可下载论文p

无需额外知识或训练！中科大等提出opera：缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法_opera大模型解码方法-爱代码爱编程

2024-03-31 分类: 人工智能深度学习机器学习 opencv 神经网络计算机视觉自然语言处理资源分享（resourc

论文：https://arxiv.org/abs/2311.17911 代码：https://github.com/shikiw/OPERA 在多模态大模型中，幻觉问题一直是一个备受关注的难题。大多数多模态大模型（Multi-Modal Large Language Models）经常对输入的图像和提示给出错误的回答，尤其在生成较长文本回答时，很容易说出

cvpr 2024 | 从第一人称视角理解世界，多模态模型离我们还有多远？_cvpr2024 多模态-爱代码爱编程

2024-03-13 分类: cvpr 计算机视觉数据集大模型

目前很多评测工作探究视觉语言大模型在不同维度上的能力，但都忽视了真实世界中非常重要的一点：未来作为智能体或机器人的大脑，多模态模型应当具备从第一人称视角理解世界的能力。针对以上问题，清华大学提出了第一人称视角的视觉问答基准数据集——EgoThink，相关论文被人工智能顶级国际会议CVPR 2024录用。EgoThink数据集定义了在真实世界中从第一人称思考

neural network diffusion论文解读-爱代码爱编程

2024-02-29 分类: 人工智能深度学习计算机视觉

详细解读：扩散模型生成神经网络参数，速度快了44倍：Neural Network Diffusion论文解读摘要：扩散模型在图像和视频生成方面取得了显著的成功。在这项工作中，我们证明了扩散模型也可以生成高性能的神经网络参数。我们的方法很简单，利用自动编码器和标准潜在扩散模型。自动编码器提取经过训练的网络参数子集的潜在表示。然后训练扩散模型，从随机噪

（2023，ssm，门控 mlp，选择性输入，上下文压缩）mamba：具有选择性状态空间的线性时间序列建模_选择性状态空间序列模型-爱代码爱编程

2024-03-29 分类: 论文笔记深度学习计算机视觉

Mamba: Linear-Time Sequence Modeling with Selective State Spaces 公和众和号：EDPJ（进 Q 交流群：922230617 或加 VX：CV_EDPJ 进 V 交流群）目录 0. 摘要 1. 简介 2. 状态空间模型 3. 选择性状态空间模型 3.1 动机：选择作为压缩

【spie独立出版，ei检索稳定】2024年前沿图像处理技术国际学术会议（aipt 2024）-爱代码爱编程

2024-04-17 分类: 人工智能深度学习目标检测图像处理运维计算机视觉嵌入式硬件

2024年前沿图像处理技术国际学术会议（AIPT 2024）定于2024年5月31日-6月2日在中国·重庆举行。会议主要围绕前沿图像处理技术展开讨论。会议旨在为从事相关研究的专家学者、工程技术人员、技术研发人员提供一个共享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和探讨，促进学术成果产业化合作的平台。大会网站：https:

自动驾驶avm环视算法-爱代码爱编程

2024-01-20 分类: 人工智能计算机视觉自动驾驶手撸avm全景代码

测试环境 opencv310 vs2022 参考：金书世界算法源码获取：链接：https://pan.baidu.com/s/1kVUA2YgRAxk7m1TYi-wsnQ?pwd=aax9 提取码：aax9 算法的实现主要是根据四个摄像头的安装位置、相机的的内外参数实现对图像的畸变矫正、视图的变换和全景的图像拼接、图像拼接的位置的平滑

描绘未知：数据缺乏场景的缺陷检测方案-爱代码爱编程

2024-01-25 分类: 机器视觉人工智能计算机视觉

了解更多方案内容，欢迎您访问官网：neuro-T | 友思特机器视觉光电检测；或联系销售经理：18124130753 导读：深度学习模型帮助工业生产实现更加精确的缺陷检测，但其准确性可能受制于数据样本的数量。友思特 Neuro-T 视觉平台克服了数据缺乏状况的困难，通过零代码设置GAN模型和无监督学习模型，轻松实现缺陷图像的标注、绘制和

友思特技术 | 一键解锁：将任意图像设备秒变gige vision设备的终极秘诀-爱代码爱编程

2024-03-13 分类: 机器视觉计算机视觉边缘计算

前言物联网发展正在走向轻便和低成本的方向。借由友思特 eBUS Edge 软件方案，可以实现将任意图像设备迅速转换为 GigE Vision 设备，进一步进行机器视觉分析处理，通过低成本的方式一键实现设备升级。边缘计算的软件处理方案对于视觉检测和工业自动化市场，传感器网络和处理能力的进步以及机器学习人工智能(AI)的引入正在为物联网(I

友思特应用 | 高精度呈现：pcb多类型缺陷检测系统-爱代码爱编程

2024-04-10 分类: 机器视觉人工智能计算机视觉缺陷检测

导读 PCB等电子产品的精密生产制造过程中，往往需要将缺陷问题100%高精度暴露。友思特 PCB 多类型缺陷检测系统，借由Neuro-T深度学习模型自动排查全部微小缺陷，为工业 PCB 生产制造提供了先进可靠的质量保障。在现代制造业中，尤其是在高精度要求的电子制造领域，诸如印刷电路板（PCB）生产的过程中，高效且准确地识别和分类多种类型的缺陷

opencv从入门到精通实战(二)——文档ocr识别（tesseract）-爱代码爱编程

2024-04-17 分类: OCR 人工智能 opencv 计算机视觉

导入环境导入必要的库 numpy: 用于处理数值计算。 argparse: 用于处理命令行参数。 cv2: OpenCV库，用于图像处理。 import numpy as np import argparse impo

【opencv】告别人工目检：深度学习技术引领工业品缺陷检测新时代-爱代码爱编程

2024-04-17 分类: 杂谈人工智能深度学习 opencv 计算机视觉

目录前言机器视觉缺陷检测工业上常见缺陷检测方法前言前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站机器视觉机器视觉是使用各种工业相机，结合传感器跟电气信号实现替代传统人工，完成对象识别、计数、测量、缺陷检测、引导定位与抓取等任务。其中工业品的缺陷检测极大

块匹配运动估计：计算机视觉中的重要技术-爱代码爱编程

2023-12-26 分类: 人工智能网络计算机视觉数字信号处理数据压缩

在计算机视觉领域，块匹配运动估计是一项重要的技术，它在视频压缩、视频稳定、目标跟踪等领域都有着广泛的应用。本文将介绍块匹配运动估计的基本原理、应用领域及发展趋势。 1. 块匹配运动估计的基本原理块匹配运动估计是利用相邻帧之间的像素块进行比对，找到最佳的匹配块以估计运动的技术。其基本原理是在视频序列中寻找相邻帧之间的对应关系，从而得到物体或者背景的运动

【opencv】示例-爱代码爱编程

2024-04-11 分类: 人工智能 opencv 计算机视觉

上层-原始图像下层：编码+解码后的lossy_img #include <opencv2/core.hpp> // 包含OpenCV核心功能的头文件 #include <opencv2/imgproc.hpp> // 包含OpenCV图像处理功能的头文件 #include <opencv2/imgco

【opencv】示例-爱代码爱编程

2024-04-11 分类: 算法人工智能 opencv 计算机视觉

left mouse button - set rectangle SHIFT+left mouse button - set GC_FGD pixels CTRL+left mouse button - set GC_BGD pixels 这段代码是一个使用OpenCV库的GrabCut算法进行图像分割的C++程序。它

【opencv】示例-爱代码爱编程

2024-04-11 分类: 算法人工智能 opencv 计算机视觉

affine imshow("image", target_image); imshow("template", template_image); imshow("warped image", warped_image); imshow("error (black: no error)", abs(errorImage) * 255

【opencv】示例-爱代码爱编程

2024-04-11 分类: 人工智能 opencv 计算机视觉

/* 这个程序可以创建一个命令行参数列表的yaml或xml文件列表 */ // 包含必要的OpenCV头文件 #include "opencv2/core.hpp" #include "opencv2/imgcodecs.hpp" #include "opencv2/highgui.hpp" #include <string> #i

stable diffusion xl优化终极指南-爱代码爱编程

2024-04-16 分类: 人工智能计算机视觉 stable diffu

如何在自己的显卡上获得SDXL的最佳质量和性能，以及如何选择适当的优化方法和工具，这一让GenAI用户倍感困惑的问题，业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。在本文中，Félix介绍了相关SDXL优化的方法论、基础优化、Pipeline优化以及组件和参数优化。值得一提的是，基于实测表现，他