代码编织梦想

DIDEC: The Dutch Image Description and Eye-tracking Corpus

Abstract

本文提供了一个荷兰语口语图像描述的语料库,结合两组眼球追踪数据:free viewing,参与者没有任何特定目的地观看图像,以及description viewing,我们跟踪眼球运动,同时参与者对他们正在观看的图像进行口头描述。本文描述了数据收集过程和语料库本身,并对图像描述中的自校正进行了初步分析,并发现了两个结果。

  1. description viewing的眼球追踪数据比free viewing任务更连贯;
  2. 图像描述的变化(也称为image specificity)在不同语言之间只有适度的相关性。我们的语料库可以用来更深入地理解图像描述任务,特别是视觉注意是如何与图像描述过程相关联的。

1. Introduction

自动图像描述是计算机视觉(CV)和自然语言处理(NLP)相结合的一项任务。其目标是让机器自动为任何图像生成自然语言描述。2014年,随着Flickr30K和MS COCO数据集的发布,自动图像描述领域出现了爆炸性增长:从Flickr收集的两个图像库,每张图像有5个众包描述。这些资源使研究人员能够训练自动学习图像和文本之间的映射的端到端系统,同时也能更好地理解人类如何描述图像。然而,现有的数据集只能对人类产生图像描述的方式提供有限的见解,因为它们只包含这个过程的结果ÿ

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_42801194/article/details/127974818

【机器学习】数据集 汇总-爱代码爱编程

Face recognition In computer vision, face images have been used extensively to develop face recognition systems

NAACL2021阅读理解论文整理-爱代码爱编程

作者:孙嘉伟 单位:燕山大学 就在5月23号,NAACL终于放出接收论文目录啦。 论文列表:https://www.aclweb.org/anthology/events/naacl-2021/   NAACL作为NLP的顶会之一,接收的论文质量也非常之高,其中有不少关于阅读理解&问答领域相关的文章以供大家研究参考。作为一个从事该研究领域的

【20211215】神经机器翻译-爱代码爱编程

Neural Machine Tranlation, NMT 1. 英语-越南语(133k)(1)法I(2)法II(3)更多...2. 德语-英语(4.5M)一些想法(法II.1)4. Tensorflow5. 评价指标(1)BLEU(2)PPL总结 原论文与代码Neural Machine Translation 地址,需要复现《Effect

吴恩达机器学习课程笔记二_chen的博客的博客-爱代码爱编程

文章目录 神经网络基础知识神经网络前向传播伪代码前向传播中单个神经元的作用 矩阵加速运算训练模型的细节常用激活函数ReLUSigmoidLinear activation functiontanh 选择激活函

structure-aware transformer for graph representation learning_嗨i,你y的博客-爱代码爱编程

Structure-Aware Transformer for Graph Representation Learning 在图表示学习中,Transformer结构通过位置编码对图形结构进行编码,克服了GNN的几个局限性

11.20日记 加 trasnform 语言模型的 小复习_樱武苏的博客-爱代码爱编程

  今天是周日,上午睡到8点多吧,比平时幸福多了,然后去射箭箭,第一靶出奇的准,后面也挺准的,射着射着手疼,就寄了,去做核酸喽,刚开始去的是黄焖鸡旁边的小区,去了没一个,高兴死了,做核酸的大白也是这样想的,收摊了,寄!去武警医院排队,我草,人好少,排了半个多小时(这种便民核酸要输入身份证号和电话号码,还要挂号,为啥不取消啊)   在去往武警医院的天桥上看

advances in graph neural networks笔记2:fundamental graph neural networks_诸神缄默不语的博客-爱代码爱编程

诸神缄默不语-个人CSDN博文目录 本书网址:https://link.springer.com/book/10.1007/978-3-031-16174-2 本文是本书第二章的学习笔记。 我们学校没买这书,但是谷歌学术

transformer论文及其变种_林林宋的博客-爱代码爱编程

文章目录 transformer模型细节slf-attn & multi-head attnabs positionwhy slf-attn transformer-XLInformer细节prob

[机器翻译]——pivot-based zero-shot translation based on fairseq_muasci的博客-爱代码爱编程

文章目录 前言翻译到en生成"伪"的、到英语的数据文件把每一个zs语言对翻译到en从fairseq-generate生成的文件中,抽取纯en文件 把en数据和所有zs语言对的tgt数据形成平行语料,然后做预处理形

【coca】美国当代语料库常用高频词汇20200个(可直接复制)_coca词汇-爱代码爱编程

COCA数量说明:原来总共是20200个,由于有大量重复的单词,所以把2565个重复的单词清理掉了!最终清理重复后的数量是17635个,每个词语之间以空格分开,详见如下: the be and of a in to hav