Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020113918 - PROCÉDÉ ET APPAREIL DE DÉTERMINATION DE RATIONALITÉ DE DÉCLARATION SUR LA BASE D'UNE ANALYSE SÉMANTIQUE, ET DISPOSITIF INFORMATIQUE

Document

说明书

发明名称 0001  

技术领域

0002  

背景技术

0003  

发明概述

技术问题

0004  

技术解决方案

0005   0006   0007   0008   0009   0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023  

有益效果

0024  

附图说明

0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099   0100   0101   0102   0103   0104   0105   0106   0107   0108   0109   0110   0111   0112   0113   0114   0115   0116   0117   0118   0119   0120   0121   0122   0123   0124   0125   0126   0127   0128   0129   0130   0131   0132   0133  

权利要求书

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20  

附图

页1 

说明书

发明名称 : 基于语义解析的语句合理性判断方法、装置、计算机设备

[0001]
本申请要求于2018年12月06日提交中国专利局、申请号为2018114898189,申请名称为“基于语义解析的语句合理性判断方法、装置、计算机设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。

技术领域

技术领域

[0002]
本申请涉及语义解析技术领域,特别涉及一种基于语义解析的语句合理性判断方法、装置、计算机设备。

背景技术

背景技术

[0003]
在现有的话术培训中,需要专业老师对学员所说语句进行判断,判断其是否合理,这需要在有专业老师在场的情况下,学员才能知道自己所说的语句是否合理,在没有专业老师在场的情况下,学员并不知道自己所说的语句是否合理,为此,在现有的话术培训中,在没有专业老师在场的情况下,学员不能判断自己所说语句的合理性。

发明概述

技术问题

[0004]
针对现有技术不足,本申请提出一种基于语义解析的语句合理性判断方法、装置、计算机设备,旨在解决在现有的话术培训中,在没有专业老师在场的情况下,学员不能判断自己所说语句的合理性的问题。

技术解决方案

[0005]
本申请提出的技术方案是:
[0006]
一种基于语义解析的语句合理性判断方法,所述方法包括:
[0007]
建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率;
[0008]
获取用户输入的待判断的语句;
[0009]
对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词;
[0010]
将所述待判断的语句对应的多个分词载入所述ngram模型;
[0011]
获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率;
[0012]
将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度;
[0013]
将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0014]
本申请还提供一种基于语义解析的语句合理性判断装置,所述装置包括:
[0015]
建立模块,用于建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率;
[0016]
第一获取模块,用于获取用户输入的待判断的语句;
[0017]
分词模块,用于对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词;
[0018]
载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型;
[0019]
第二获取模块,用于获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率;
[0020]
计算模块,用于将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度;
[0021]
判断模块,用于将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0022]
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法的步骤。
[0023]
本申请还提供一种计算机非易失性可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

有益效果

[0024]
将用户输入的待判断的语句进行分词处理,得到多个分词,将多个分词载入ngram模型,ngram模型对多个分词进行计算,计算多个分词中各分词的上下文出现概率,根据多个分词中各分词的上下文出现概率的乘积,输出待判断的语句的困惑度,根据待判断的语句的困惑度,判断待判断的语句的合理性,从而用户可以判断自己所说的语句是否合理,可快速改进自己的话术,旨在解决在现有的话术培训中,在没有专业老师在场的情况下,学员不能判断自己所说语句的合理性的问题。

附图说明

[0025]
图1是应用本申请实施例提供的基于语义解析的语句合理性判断方法的流程图;
[0026]
图2是应用本申请实施例提供的基于语义解析的语句合理性判断装置的功能模块图;
[0027]
图3是应用本申请实施例提供的计算机设备的结构示意框图。
[0028]
本申请的最佳实施方式
[0029]
如图1所示,本申请实施例提出一种基于语义解析的语句合理性判断方法,所述方法包括以下步骤:
[0030]
步骤S101、建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率。
[0031]
获得训练语料的分词,利用训练语料的分词和贝叶斯算法建立ngram模型,ngram模型承载每个分词的上下文信息和概率,在将语句的分词载入ngram模型之后,ngram模型计算各分词的上下文出现概率,在完成计算之后,输出各分词的上下文出现概率。
[0032]
在一些实施例中,对ngram模型的训练过程包括:
[0033]
爬取领域内的语料;
[0034]
对语料进行过滤,获得过滤后的语料;
[0035]
对过滤后的语料进行中文分词,获得分词后的语料;
[0036]
对分词后的语料进行领域实体纠正,获得纠正后的语料;
[0037]
通过kenlm训练工具对纠正后的语料进行训练;
[0038]
根据训练结果判断是否达到预设目标;
[0039]
若达到预设目标,则判断ngram模型为合格模型。
[0040]
首先,爬取领域内的语料,爬取得到的语料包含了很多噪声,因此需要对其进行过滤,比如去除无意义符号、去除数字、去除英文以及去除无意义标点符号等。接着进行中文分词,中文分词对于通用的语言准确率较高,但是在特定领域内的分词结果效果较差,原因在于训练分词的语料包含特定领域语料较少,因此接下来进行领域实体的纠正;最后,将分词结果进行ngram模型的训练,采用的模型训练工具为kenlm,评价指标为困惑度Perplexity。根据训练结果判断是否达到预设目标,若达到预设目标,则判断ngram模型为合格模型,可以使用ngram模型。
[0041]
步骤S102、获取用户输入的待判断的语句。
[0042]
在用户输入待判断的语句之后,获取用户输入的待判断的语句。待判断的语句的输入方式可以是语音输入。
[0043]
步骤S103、对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词。
[0044]
在获取用户输入的待判断的语句之后,对待判断的语句进行分词处理,在完成分词处理之后,获得待判断的语句对应的多个分词。在本实施例中,自身具备分词功能,直接对待判断的语句进行分词处理,从而获得待判断的语句对应的多个分词。在一些实施例中,将待判断的语句发送给分词模型,通过分词模型对待判断的语句进行分词处理,在分词模型完成对待判断的语句的分词处理之后,接收分词模型发送待判断的语句对应的多个分词,获得待判断的语句对应的多个分词。
[0045]
步骤S104、将所述待判断的语句对应的多个分词载入所述ngram模型。
[0046]
在获得待判断的语句对应的多个分词之后,将待判断的语句对应的多个分词载入ngram模型,若没有发送依赖数值给ngram模型,则ngram模型按照自身默认的依赖数值计算待判断的语句对应的多个分词中各分词的上下文出现概率,若发送依赖数值给ngram模型,则ngram模型按照接收到的依赖数值计算待判断的语句对应的多个分词中各分词的上下文出现概率。
[0047]
步骤S105、获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[0048]
在ngram模型完成计算待判断的语句对应的多个分词中各分词的上下文出现概率之后,获取所述ngram模型输出的待判断的语句对应的多个分词中各分词的上下文出现概率。
[0049]
在本实施例中,在步骤S104中,包括:
[0050]
将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型,其中所述预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数。
[0051]
预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数,例如,预设依赖数值是1,在计算分词的上下文出现概率时一个分词依赖前一个分词。在获得待判断的语句对应的多个分词之后,将待判断的语句对应的多个分词载入ngram模型,同时,将预设依赖数值发送给ngram模型,ngram模型按照接收到的预设依赖数值计算待判断的语句对应的多个分词中各分词的上下文出现概率。
[0052]
相应地,在步骤S105中,包括:
[0053]
通过所述ngram模型根据所述预设依赖数值计算所述待判断的语句对应的多个分词中各分词的上下文出现概率;
[0054]
接收所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[0055]
在ngram模型接收到预设依赖数值、待判断的语句对应的多个分词之后,ngram模型根据预设依赖数值计算待判断的语句对应的多个分词中各分词的上下文出现概率,在完成计算之后,接收ngram模型输出的待判断的语句对应的多个分词中各分词的上下文出现概率。
[0056]
在本实施例中,在所述将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型的步骤中,包括:
[0057]
识别所述待判断的语句对应的多个分词中分词的数量;
[0058]
将所述待判断的语句对应的多个分词中分词的数量与预设数量进行比较;
[0059]
若所述待判断的语句对应的多个分词中分词的数量大于所述预设数量,则将预设依赖数值设定为第一数值;
[0060]
若所述待判断的语句对应的多个分词中分词的数量小于或者等于所述预设数量,则将预设依赖数值设定为第二数值,其中所述第二数值小于所述第一数值;
[0061]
将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[0062]
在获得待判断的语句对应的多个分词之后,识别待判断的语句对应的多个分词中分词的数量,根据待判断的语句对应的多个分词中分词的数量不同,设定为不同的数值,在识别到待判断的语句对应的多个分词中分词的数量之后,将待判断的语句对应的多个分词中分词的数量与预设数量进行比较,在本实施例中,预设数量为10,若待判断的语句对应的多个分词中分词的数量大于预设数量,则将预设依赖数值设定为第一数值,在本实施例中,第一数值为2,若待判断的语句对应的多个分词中分词的数量小于或者等于预设数量,则将预设依赖数值设定为第二数值,其中第二数值小于第一数值,在本实施例中,第二数值为1。在完成设定预设依赖数值之后,将待判断的语句对应的多个分词载入ngram模型,同时将预设依赖数值发送给所述ngram模型。
[0063]
在一些实施例中,在所述将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型的步骤中,包括:
[0064]
提示用户输入预设依赖数值;
[0065]
当接收到用户输入所述预设依赖数值时,将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[0066]
在获得待判断的语句对应的多个分词之后,提示用户输入预设依赖数值,在用户完成输入之后,接收用户输入的预设依赖数值,当接收到用户输入预设依赖数值时,将待判断的语句对应的多个分词载入ngram模型,同时将预设依赖数值发送给ngram模型。
[0067]
步骤S106、将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度。
[0068]
在获取待判断的语句对应的多个分词中各分词的上下文出现概率之后,将将待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出待判断的语句的困惑度,待判断的语句的困惑度与待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算后的概率成反比,语句的困惑度越小,语句的概率越大,语句越合理。
[0069]
步骤S107、将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0070]
在获得待判断的语句的困惑度之后,将待判断的语句的困惑度与预设困惑度阈值进行比较,在本实施例中,预设困惑度阈值为用户输入一个困惑度阈值,根据比较结果,判断待判断的语句的合理性。
[0071]
具体地,在步骤S107中,包括:
[0072]
将所述待判断的语句的困惑度与预设困惑度阈值进行比较;
[0073]
若所述待判断的语句的困惑度小于所述预设困惑度阈值,则判断所述待判断的语句为合理的语句;
[0074]
若所述待判断的语句的困惑度大于或者等于所述预设困惑度阈值,则判断所述待判断的语句为不合理的语句;
[0075]
当所述待判断的语句为不合理的语句时,对用户进行警告提醒。
[0076]
在获得待判断的语句的困惑度之后,将待判断的语句的困惑度与预设困惑度阈值进行比较,若待判断的语句的困惑度小于预设困惑度阈值,则判断待判断的语句为合理的语句,若待判断的语句的困惑度大于或者等于预设困惑度阈值,则判断待判断的语句为不合理的语句,不合理的语句需要进行改正,当待判断的语句为不合理的语句时,对用户进行警告提醒,以便用户进行改正。
[0077]
在一些实施例中,预设困惑度阈值并非是用户输入一个困惑度阈值,而是通过计算所得,具体地,在步骤S107中,包括:
[0078]
接收用户输入多条合理的语句;
[0079]
对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词;
[0080]
将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型;
[0081]
获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率;
[0082]
将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度;
[0083]
根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度;
[0084]
将所述标准困惑度的60%作为预设困惑度阈值;
[0085]
将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0086]
用户筛选出多个合理的语句并输入,在本实施例中,多个合理的语句为200条合理的语句,接收用户输入多条合理的语句,对多条合理的语句中每一条合理的语句进行分词处理,获得多条合理的语句中每一条合理的语句对应的多个分词,也就是说,每一条合理的语句都需要进行分词处理,将多条合理的语句中每一条合理的语句对应的多个分词分别载入ngram模型,也就是说,每一条合理的语句对应的多个分词都需要载入ngram模型,ngram模型计算每一条合理的语句对应的多个分词中各分词的上下文出现概率,然后ngram模型输出每一条合理的语句对应的多个分词中各分词的上下文出现概率,获取ngram模型输出的多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率,将多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出多条合理的语句中每一条合理的语句的困惑度,根据多条合理的语句中每一条合理的语句的困惑度,计算多条合理的语句的平均困惑度,获得标准困惑度,在得到标准困惑度之后,为了进一步提高语句的合理性,将标准困惑度的60%作为预设困惑度阈值,从而得到预设困惑度阈值,将待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断待判断的语句的合理性。
[0087]
综上所述,将用户输入的待判断的语句进行分词处理,得到多个分词,将多个分词载入ngram模型,ngram模型对多个分词进行计算,计算多个分词中各分词的上下文出现概率,根据多个分词中各分词的上下文出现概率的乘积,输出待判断的语句的困惑度,根据待判断的语句的困惑度,判断待判断的语句的合理性,从而用户可以判断自己所说的语句是否合理,可快速改进自己的话术,旨在解决在现有的话术培训中,在没有专业老师在场的情况下,学员不能判断自己所说语句的合理性的问题。
[0088]
如图2所示,本申请实施例提出一种基于语义解析的文本准确率计算装置1,装置1包括建立模块11、第一获取模块12、分词模块13、载入模块14、第二获取模块15、计算模块16和判断模块17。
[0089]
建立模块11,用于建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率。
[0090]
在一些实施例中,装置1包括:
[0091]
第一爬取模块,用于爬取领域内的语料;
[0092]
第一过滤模块,用于对语料进行过滤,获得过滤后的语料;
[0093]
第一中文分词模块,用于对过滤后的语料进行中文分词,获得分词后的语料;
[0094]
第一纠正模块,用于对分词后的语料进行领域实体纠正,获得纠正后的语料;
[0095]
第一训练模块,用于通过kenlm训练工具对纠正后的语料进行训练;
[0096]
第一判断模块,用于根据训练结果判断是否达到预设目标;
[0097]
第二判断模块,用于若达到预设目标,则判断ngram模型为合格模型。
[0098]
第一获取模块12,用于获取用户输入的待判断的语句。
[0099]
分词模块13,用于对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词。
[0100]
载入模块14,用于将所述待判断的语句对应的多个分词载入所述ngram模型。
[0101]
第二获取模块15,用于获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[0102]
在本实施例中,载入模块14包括:
[0103]
第一子载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型,其中所述预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数。
[0104]
相应地,第二获取模块15包括:
[0105]
第一子计算模块,用于通过所述ngram模型根据所述预设依赖数值计算所述待判断的语句对应的多个分词中各分词的上下文出现概率;
[0106]
第一子接收模块,用于接收所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[0107]
在本实施例中,第一子载入模块包括:
[0108]
第一子识别模块,用于识别所述待判断的语句对应的多个分词中分词的数量;
[0109]
第一子判断模块,用于将所述待判断的语句对应的多个分词中分词的数量与预设数量进行比较;
[0110]
第一子设定模块,用于若所述待判断的语句对应的多个分词中分词的数量大于所述预设数量,则将预设依赖数值设定为第一数值;
[0111]
第二子设定模块,用于若所述待判断的语句对应的多个分词中分词的数量小于或者等于所述预设数量,则将预设依赖数值设定为第二数值,其中所述第二数值小于所述第一数值;
[0112]
第二子载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[0113]
在一些实施例中,第一子载入模块包括:
[0114]
第一子提示模块,用于提示用户输入预设依赖数值;
[0115]
第三子载入模块,用于当接收到用户输入所述预设依赖数值时,将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[0116]
计算模块16,用于将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度。
[0117]
判断模块17,用于将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0118]
具体地,判断模块17包括:
[0119]
第一子比较模块,用于将所述待判断的语句的困惑度与预设困惑度阈值进行比较;
[0120]
第二子判断模块,用于若所述待判断的语句的困惑度小于所述预设困惑度阈值,则判断所述待判断的语句为合理的语句;
[0121]
第三子判断模块,用于若所述待判断的语句的困惑度大于或者等于所述预设困惑度阈值,则判断所述待判断的语句为不合理的语句;
[0122]
第一子提醒模块,用于当所述待判断的语句为不合理的语句时,对用户进行警告提醒。
[0123]
在一些实施例中,预设困惑度阈值并非是用户输入一个困惑度阈值,而是通过计算所得,具体地,判断模块17包括:
[0124]
第二子接收模块,用于接收用户输入多条合理的语句;
[0125]
第二子分词模块,用于对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词;
[0126]
第三子载入模块,用于将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型;
[0127]
第二子获取模块,用于获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率;
[0128]
第二子计算模块,用于将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度;
[0129]
第三子计算模块,用于根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度;
[0130]
第一子阈值设定模块,用于将所述标准困惑度的60%作为预设困惑度阈值;
[0131]
第四子判断模块,用于将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[0132]
如图3所示,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于语义解析的语句合理性判断方法的模型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于语义解析的语句合理性判断方法。
[0133]
本申请一实施例还提供一种计算机非易失性可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于语义解析的语句合理性判断方法。

权利要求书

[权利要求 1]
一种基于语义解析的语句合理性判断方法,其特征在于,所述方法包括: 建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率; 获取用户输入的待判断的语句; 对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词; 将所述待判断的语句对应的多个分词载入所述ngram模型; 获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率; 将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度; 将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 2]
根据权利要求1所述的基于语义解析的语句合理性判断方法,其特征在于,在所述将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性的步骤中,包括: 接收用户输入多条合理的语句; 对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词; 将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型; 获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率; 将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度; 根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度; 将所述标准困惑度的60%作为预设困惑度阈值; 将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 3]
根据权利要求1所述的基于语义解析的语句合理性判断方法,其特征在于,在所述将所述待判断的语句对应的多个分词载入所述ngram模型的步骤中,包括: 将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型,其中所述预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数。
[权利要求 4]
根据权利要求3所述的基于语义解析的语句合理性判断方法,其特征在于,在所述获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率的步骤中,包括: 通过所述ngram模型根据所述预设依赖数值计算所述待判断的语句对应的多个分词中各分词的上下文出现概率; 接收所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[权利要求 5]
根据权利要求3所述的基于语义解析的语句合理性判断方法,其特征在于,在所述将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型的步骤中,包括: 识别所述待判断的语句对应的多个分词中分词的数量; 将所述待判断的语句对应的多个分词中分词的数量与预设数量进行比较; 若所述待判断的语句对应的多个分词中分词的数量大于所述预设数量,则将预设依赖数值设定为第一数值; 若所述待判断的语句对应的多个分词中分词的数量小于或者等于所述预设数量,则将预设依赖数值设定为第二数值,其中所述第二数值小于所述第一数值; 将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[权利要求 6]
根据权利要求3所述的基于语义解析的语句合理性判断方法,其特征在于,在所述将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型的步骤中,包括: 提示用户输入预设依赖数值; 当接收到用户输入所述预设依赖数值时,将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[权利要求 7]
根据权利要求1所述的基于语义解析的语句合理性判断方法,其特征在于,在所述将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性的步骤中,包括: 将所述待判断的语句的困惑度与预设困惑度阈值进行比较; 若所述待判断的语句的困惑度小于所述预设困惑度阈值,则判断所述待判断的语句为合理的语句; 若所述待判断的语句的困惑度大于或者等于所述预设困惑度阈值,则判断所述待判断的语句为不合理的语句; 当所述待判断的语句为不合理的语句时,对用户进行警告提醒。
[权利要求 8]
一种基于语义解析的语句合理性判断装置,其特征在于,所述装置包括: 建立模块,用于建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率; 第一获取模块,用于获取用户输入的待判断的语句; 分词模块,用于对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词; 载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型; 第二获取模块,用于获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率; 计算模块,用于将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度; 判断模块,用于将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 9]
根据权利要求8所述的基于语义解析的语句合理性判断装置,其特征在于,所述判断模块包括: 第二子接收模块,用于接收用户输入多条合理的语句; 第二子分词模块,用于对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词; 第三子载入模块,用于将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型; 第二子获取模块,用于获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率; 第二子计算模块,用于将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度; 第三子计算模块,用于根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度; 第一子阈值设定模块,用于将所述标准困惑度的60%作为预设困惑度阈值; 第四子判断模块,用于将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 10]
根据权利要求8所述的基于语义解析的语句合理性判断装置,其特征在于,所述载入模块包括: 第一子载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型,其中所述预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数。
[权利要求 11]
根据权利要求10所述的基于语义解析的语句合理性判断装置,其特征在于,所述第二获取模块包括: 第一子计算模块,用于通过所述ngram模型根据所述预设依赖数值计算所述待判断的语句对应的多个分词中各分词的上下文出现概率; 第一子接收模块,用于接收所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[权利要求 12]
根据权利要求10所述的基于语义解析的语句合理性判断装置,其特征在于,所述第一子载入模块包括: 第一子识别模块,用于识别所述待判断的语句对应的多个分词中分词的数量; 第一子判断模块,用于将所述待判断的语句对应的多个分词中分词的数量与预设数量进行比较; 第一子设定模块,用于若所述待判断的语句对应的多个分词中分词的数量大于所述预设数量,则将预设依赖数值设定为第一数值; 第二子设定模块,用于若所述待判断的语句对应的多个分词中分词的数量小于或者等于所述预设数量,则将预设依赖数值设定为第二数值,其中所述第二数值小于所述第一数值; 第二子载入模块,用于将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[权利要求 13]
根据权利要求10所述的基于语义解析的语句合理性判断装置,其特征在于,所述第一子载入模块包括: 第一子提示模块,用于提示用户输入预设依赖数值; 第三子载入模块,用于当接收到用户输入所述预设依赖数值时,将所述待判断的语句对应的多个分词载入所述ngram模型,同时将所述预设依赖数值发送给所述ngram模型。
[权利要求 14]
根据权利要求8所述的基于语义解析的语句合理性判断装置,其特征在于,所述判断模块包括: 第一子比较模块,用于将所述待判断的语句的困惑度与预设困惑度阈值进行比较; 第二子判断模块,用于若所述待判断的语句的困惑度小于所述预设困惑度阈值,则判断所述待判断的语句为合理的语句; 第三子判断模块,用于若所述待判断的语句的困惑度大于或者等于所述预设困惑度阈值,则判断所述待判断的语句为不合理的语句; 第一子提醒模块,用于当所述待判断的语句为不合理的语句时,对用户进行警告提醒。
[权利要求 15]
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现基于语义解析的语句合理性判断方法,所述方法包括: 建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率; 获取用户输入的待判断的语句; 对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词; 将所述待判断的语句对应的多个分词载入所述ngram模型; 获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率; 将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度; 将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 16]
根据权利要求15所述的计算机设备,其特征在于,在所述将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性的步骤中,包括: 接收用户输入多条合理的语句; 对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词; 将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型; 获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率; 将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度; 根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度; 将所述标准困惑度的60%作为预设困惑度阈值; 将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 17]
根据权利要求15所述的计算机设备,其特征在于,在所述将所述待判断的语句对应的多个分词载入所述ngram模型的步骤中,包括: 将所述待判断的语句对应的多个分词载入所述ngram模型,同时将预设依赖数值发送给所述ngram模型,其中所述预设依赖数值是在计算分词的上下文出现概率时一个分词依赖前面分词的个数。
[权利要求 18]
根据权利要求17所述的计算机设备,其特征在于,在所述获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率的步骤中,包括: 通过所述ngram模型根据所述预设依赖数值计算所述待判断的语句对应的多个分词中各分词的上下文出现概率; 接收所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率。
[权利要求 19]
一种计算机非易失性可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现基于语义解析的语句合理性判断方法,所述方法包括: 建立ngram模型,其中所述ngram模型用于计算各分词的上下文出现概率; 获取用户输入的待判断的语句; 对所述待判断的语句进行分词处理,获得所述待判断的语句对应的多个分词; 将所述待判断的语句对应的多个分词载入所述ngram模型; 获取所述ngram模型输出的所述待判断的语句对应的多个分词中各分词的上下文出现概率; 将所述待判断的语句对应的多个分词中各分词的上下文出现概率进行乘积计算,输出所述待判断的语句的困惑度; 将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。
[权利要求 20]
根据权利要求19所述的计算机非易失性可读存储介质,其特征在于,在所述将所述待判断的语句的困惑度与预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性的步骤中,包括: 接收用户输入多条合理的语句; 对所述多条合理的语句中每一条合理的语句进行分词处理,获得所述多条合理的语句中每一条合理的语句对应的多个分词; 将所述多条合理的语句中每一条合理的语句对应的多个分词分别载入所述ngram模型; 获取所述ngram模型输出的所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率; 将所述多条合理的语句中每一条合理的语句对应的多个分词中各分词的上下文出现概率分别进行乘积计算,输出所述多条合理的语句中每一条合理的语句的困惑度; 根据所述多条合理的语句中每一条合理的语句的困惑度,计算所述多条合理的语句的平均困惑度,获得标准困惑度; 将所述标准困惑度的60%作为预设困惑度阈值; 将所述待判断的语句的困惑度与所述预设困惑度阈值进行比较,根据比较结果,判断所述待判断的语句的合理性。

附图