归档: 2019/4

0

300行python代码从零开始构建基于知识图谱的电影问答系统2-系统业务逻辑介绍

昨天把这个教程的目录给理出来了,然后今天就想趁着这满腔热情(无心搬砖)把剩下的教程也写了。 对于整个系统,不管具体细节是怎么实现的,是逻辑一定要理清楚,于是这一节主要介绍各个模块的逻辑,为什么要这么做。 首先我简单的画了一个示意图(这叫啥图我也还给软件工程老师了,肯定不规范,帮老师画了一上午的图,心都累了,将就着看吧)从第一部分的目录和上面的示意图我们我们都可以了解到,实际上要处理的就是那几个

0

300行python代码从零开始构建基于知识图谱的电影问答系统4-用户问题预处理

今天冷得,我在五月份穿了三件衣服,你敢相信。。。 这篇主要介绍对用户问题的处理,也就是从获取用户问题到明白用户意图这个过程,主要涉及到命名实体识别(这个任务简单,我就用词性标注来代替了),问题分类,以及填充问题模板这几个部分。介绍的时候,可能会用一些代码来说明,但是下面列出来的代码并不完整,完整的代码请参照github。这些代码只是辅助理解整个过程,这样去看代码的时候才容易理清函数之间的来龙去

0

300行python代码从零开始构建基于知识图谱的电影问答系统5-答案获取

啦啦啦,终于快写完了,虽然我也知道并没有写什么实质性的东西,至少我坚持下来啦,后面再慢慢多拧拧,少一些水分。 在上一篇中,主要介绍了如何从接收到的用户问题中抽取关键信息,以及如何识别用户的意图,那么接下来就将介绍在得到了这些信息后,如何在知识图谱中查询答案。我在处理这个问题时,想得很直接,简单来说,每个问题模板就对应了一个用户意图,那么就按照每个意图来写查询语句,这是一种简单粗暴的方法,优点就

0

300行python代码从零开始构建基于知识图谱的电影问答系统3-实验环境和实验数据准备

貌似很久没有写了,这段时间一直在忙着准备复试,就有点耽误了,好吧,今天继续写。你们的魔鬼又来啦 (什么鬼 在上一篇中,我对整个系统的业务逻辑啰里啰唆的梳理了一遍,如果你被我绕晕了,那也没关系,因为不用看上面那篇也能继续往下走,当你自己理清楚他的逻辑的时候,你就会有一种踏破铁鞋无觅处,柳暗花明又一村的感觉,好吧下面言归正传。 这一篇主要介绍实验的准备工作,也就是为后续工作铺平道路,主要包含实

0

我的搬砖工具(科研工具)推荐-附下载链接

论文搜索: semantic scholar or 谷歌学术 or 谷歌学术搜索按钮插件 NLP论文list: ACL Anthology 第一个国内都可以访问,后面的需要访问国外,如果学校图书馆可以上谷歌学术的话,可以直接使用后两个。做自然语言处理的可以在ACL网站上找最新的论文。 文献管理工具:Mendeley 之前不习惯用文献管理工具,就把论文分门别类的放在指定的文件夹下,但

0

300行python代码从零开始构建基于知识图谱的电影问答系统-目录

平时除了看论文还是看论文,感觉有点无聊,于是嘛就想着搞点东西来玩玩,然后就搞了一个非常简单的基于知识图谱的电影问答系统。系统是用python实现的,大概只花了1天吧,代码也仅有300多行,可以说是很容易上手了。然后在这里也简单的记录下整个搭建过程,梳理思路,给那些像我一样想玩玩的童鞋一些参考,大佬请自动跳过。 首先给来看看我们要实现的是什么东西,效果图如下:完成这个系统主要涉及到以下一些知识点

0

Beam search 算法的通俗理解

Beam search 算法在文本生成中用得比较多,用于选择较优的结果(可能并不是最优的)。接下来将以seq2seq机器翻译为例来说明这个Beam search的算法思想。在机器翻译中,beam search算法在测试的时候用的,因为在训练过程中,每一个decoder的输出是有与之对应的正确答案做参照,也就不需要beam search去加大输出的准确率。有如下从中文到英语的翻译:中文:1我 爱 学

0

【论文笔记14】Gated-Attention Readers for Text Comprehension

本文主要介绍GA reader模型的基本思想,由论文《Gated-Attention Readers for Text Comprehension》提出,论文直通车 1 论文概述本篇论文的思想其实是很简单的,可以把其看成是AS reader模型的扩展,尽管模型简单,但是也取得了不错的成绩,也证明了乘法操作机制带来的效果显著。值得一提的是,论文中的相关工作部分,对之前的模型进行了分门别类的概述,这一