代码编织梦想

spaCy (1)安装和测试代码的运行 windows环境-爱代码爱编程

首先,我一直想搞一个聊天机器人,这回终于开始学习并开始搞了,希望可以坚持下去搞出一个半成品或者成品 自然语言处理NLP挺火的,因为AI人工智能的应用,和现在客服系统、反馈、问答、引导等等的需求很多,是必须要学习一下的。 库用的spaCy(英['speɪsɪ]美[ˈspesi]),语言在学习阶段使用英语模型和部分参杂中文做测试使用 先记录和搞清几个概念

自动驾驶最全基础知识、课程、论文、数据集、开源软件等资源整理分享-爱代码爱编程

    自动驾驶汽车(Autonomous vehicles)又称无人驾驶汽车、电脑驾驶汽车、或轮式移动机器人,是一种通过电脑系统实现无人驾驶的智能汽车。在20世纪已有数十年的历史,21世纪初呈现出接近实用化的趋势。自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。

程序员必读-统计思考-程序员必备概率和统计知识-爱代码爱编程

本书介绍     《统计思考:程序员必备概率和统计知识》是一种讲解统计课程的教科书。它强调使用统计数据来探索大型数据集。它采用计算方法,有几个优点: 学生编写程序是发展和测试他们理解的一种方式。例如,编写函数来计算最小二乘拟合、残差和决定系数。编写和测试这段代码需要他们理解概念,并隐含地纠正误解。 学生通过实验来测试统计结果。例如,他们通过从几个

Paddle2.0让你成为诗词大师-PaddlePoetry-爱代码爱编程

项目地址:https://github.com/ZMpursue/LSTM_Write_Poetry 本教程将通过一个示例对LSTM进行介绍。通过搭建训练LSTM网络,我们将训练一个模型来生成唐诗。本文将对该实现进行详尽的解释,并阐明此模型的工作方式和原因。并不需要过多专业知识,但是可能需要新手花一些时间来理解的模型训练的实际情况。为了节省时间,

NLP基本文本处理技能-爱代码爱编程

目录​ 一.基本文本处理技能 暂时先学一下基于词典的方法、基于统计的分词和词、字符频率统计 1.基于词典的方法(字符串匹配,机械分词方法) 1.1正向最大匹配思想MM 1.2逆向最大匹配算法RMM 1.3双向最大匹配法(Bi-directction Matching method,BM) 2.基于统计的分词(无字典分词) 2

NLP入门训练-爱代码爱编程

新生训练(New Version, updating) 我们想通过这样一个项目,给新进实验室的同学提供一些基础训练,快速提高水平。 训练题目 • Linux & Shell • 一些简单的Linux和Shell命令训练,学会使用Linux • 练习内容可以从 https://github.com/HIT-SCIR/scir-training-day

G. 知识图谱 语义搜索-爱代码爱编程

G. 知识图谱 语义搜索 概述 语义搜索基本框架 语义模型 数据来源包括 知识表示 和 文档表示语义搜索 查询构建 关键词表单自然语言形式化语言查询处理 IR-style匹配和排序DB-style精确匹配KG-style匹配和推理结果展示 查询可视化文档和数据展示概要查询优化

贝叶斯算法对PDF文档归类-爱代码爱编程

前段时间看到有个群在招文档分类志愿者,主要工作是把各个渠道收集到的分析报告(PDF格式)进行分类整理,就想起来机器学习中有个朴素贝叶斯算法正好是处理这种语言文字分类的利器,于是决定写一个分类的脚本来玩玩儿。 整个处理思路大致如下: 1、获取PDF文档中文字内容另存在TXT文件(pdfminer) 2、对TXT文件分词并获取特征向量(jieba) 3

心法利器[12] | 任务方案思考:序列标注(NER)篇-爱代码爱编程

【前沿重器】 全新栏目,本栏目主要和大家一起讨论近期自己学习的心得和体会,与大家一起成长。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。 往期回顾 心法利器[7] | 漫谈语义相似度与语义向量表征心法利器[8] | 模型热更新小记心法利器[9] | 算法项目从0到1孵化过程心法利器[10] | 算法项目从1到N的进化心法利器[11] |

中文NER的正确打开方式: 词汇增强方法总结 (从Lattice LSTM到FLAT)-爱代码爱编程

点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要21分钟 跟随小博主,每天进步一丢丢 来源:知乎    作者:JayLou娄杰 编辑:深度学习自然语言处理 链接:见文末阅读原文 本文仅做学术分享,侵删 众所周知,与英文NER相比,中文NER通常采取基于字符的方式。究其缘由,由于中文分词存在误差,基于字符的NER

泛统计理论初探——再谈注意力机制模型-爱代码爱编程

神经网络学习-再谈注意力机制 再谈Attention注意力机制     在上一篇文章中,我们介绍了Seq2Seq基本原理和使用attention机制的效果,本次文章将继续深入讨论注意力机制的原理,进一步弄懂为什么引入注意力机制后模型的准确性得以提升。注意力机制其实最早是使用在图形识别的领域,当使用者使用了注意力机制后,比传统的CNN的识别效果要更好。而这

【学记助理】一开篇:介绍-爱代码爱编程

文章目录 前言一、要做什么?功能场景主要任务二、设计理念1. 价值主张2. 核心特性三、如何做:社区合作从知识管理到人工智能开放社区合作原则四、参考 前言 现代社会高速发展,信息爆炸但知识有限,物质丰富但精神匮乏,书籍、视频、文档等知识载体形式单一,内容碎片化、同质化、功利化,工具繁多但使用成本高,不能满足高效学习与创新的需求。致力于开

DiSAN(18’AAAI)-爱代码爱编程

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding https://github.com/taoshen58/DiSAN motivation 取代RNN和CNN,提出只有attention组成的适用于不同NLP任务的框架 Mul

Anaconda和conda命令的安装和使用-爱代码爱编程

作者 | 弗拉德 来源 | 弗拉德(公众号:fulade_me) Anaconda Anaconda是一个开源的工具,目前拥有超过六百万的用户。Anaconda致力于提供最便捷的方式来使用Python进行数据科学计算和机器学习。目前,Anaconda拥有超过250+的数据科学工具包,conda工具包可用于Windows,MacOS和Linux三种平台的

06.逻辑回归介绍-爱代码爱编程

【数学基础-各种熵的概念】 联合熵: H ( X , Y

关于苏州大学计算机872考研资料专栏说明与使用详情-爱代码爱编程

关于苏州大学计算机872考研资料专栏说明与使用详情   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博主目前仅在CSDN中写博客,唯一博客更新的地址为:亓官劼的博客 ​ 本文章将持续更新关于苏州大学计算机872考研资料专栏说明与使用详情等相关资料,主要为本人的一些复习笔记,如需订阅可

POSIT-DRMM(18’Google)-爱代码爱编程

Deep Relevance Ranking Using Enhanced Document-Query Interactions https://github.com/nlpaueb/deep-relevance-ranking. Introduction 在DRMM(它使用对上下文不敏感的术语编码和查询-文档术语交互)的基础上,

Chapter7-8_Deep Learning for Constituency Parsing-爱代码爱编程

文章目录 1 什么是Constituency Parsing2 解决方案2.1 Chart-based Approach2.2 Transition-based Approach2.3 Grammer as Foreign Language 本文为李弘毅老师【Deep Learning for Constituency Parsing】的课程笔

Linux 后台运行python代码-爱代码爱编程

有时候我们需要花比较长时间的跑python程序时,可以考虑后台运行代码。 例如:在nlp领域中,往往需要花比较长的时间需训练一个模型,而通过远程工具连接Linux服务器跑python代码,如果中途关闭shell远程工具,正在运行的python代码就会终止,这时,可以通过使用后台运行python程序的方式,设置输出log保存文件,关闭shell远程工具

【AI】生成模型和判定模型-爱代码爱编程

文章目录 前言二者的区别维基百科上Generative案例:常见模型 前言 对于分类模型,一般有三种建模方法: 生成模型判定模型直接学习决策边界。(本文先不讲)二者的区别 生成式模型: 举例:现在要判定一只羊是山羊还是绵羊,根据山羊的特征首先学习出一个山羊的模型A,然后根据绵羊的特征学习出一个绵羊的模型B,然后从这只羊中提取特征C,之后