[0059] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060] 实施例1
[0061] 参照图1所示,本发明提供一种基于人工智能的学生教材内容审核评价方法,包括以下步骤:
[0062] S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0063] S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
[0064] S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0065] 上述中对各页面对应的文本部分进行格式合规审核,其具体审核过程如下:
[0066] A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
[0067] A2:分别提取各文字对应的字体和字号;
[0068] A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
[0069] 在一个具体实施例中,解析各符合文字对应的符合类型,其具体解析方式为若某文字对应的字体和字号与学生教材文本对应的合规字体和合规字号均匹配成功,则该文字对应的符合类型为双重符合,若某文字只有字体匹配成功,则该文字对应的符合类型为字体符合,若某文字只有字号匹配成功,则该文字对应的符合类型为字号符合;
[0070] A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
[0071] A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式 计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。
[0072] 上述格式合规度计算公式中符合文字对应的符合因子越大,符合文字数量越多,格式合规度越大;
[0073] 需要说明的是,上述中对目标教材的文本部分进行格式合规审核,其目的在于学生教材中文字的字体和字号直接影响学生对文字的辨认能力,例如有些字体由于笔画过于特殊,导致无法直观辨认文字,有些字号由于过小也无法直观辨认文字,如果忽略对文本的格式合规审核,就容易出现一些文字采用不合格的字体和字号进行显示,进而由于文字无法直观辨认,不仅影响学生的理解力,还影响学生的视力。
[0074] 上述中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
[0075] B1:对各页面对应的文本部分进行分句划分,得到若干分句;
[0076] B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
[0077] B3:从各页面对应各分句存在的若干词组中提取出关键词组;
[0078] B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
[0079] B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,其中要素参数包括发生时间、发生地点、人物、背景和过程,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
[0080] B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
[0081] B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为ηi表示为第i个页面对应的史事表述合规度,ri表示为第i
个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数;
[0082] 上述史事表述合规度计算公式中,匹配成功的史事关联分句数量越多,各匹配成功的史事关联分句对应的合规权重值越大,史事表述合规度越大;
[0083] 需要说明的是,对目标教材的文本部分进行史事表述合规度审核的目的在于:学生教材中史事表述的真实性会教材的权威性,如果不对文本部分的史事表述进行审核,就难以发现史事表述中的错误部分,这样的教材一旦投入使用,会严重降低教材的权威性,进而给学生错误的引导。
[0084] 上述中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
[0085] C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
[0086] 上述中审核数据库中存储的敏感词组集合包括违禁词、低俗词、违规词等;
[0087] C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为 ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量,其中各页面中存在的重点词组数量越少,该页面对应的用词合规度越大;
[0088] S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数,其评价公式为表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1;
[0089] 本发明实施例在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,有效弥补了现有技术中文本部分审核指标单一造成的对文本中的一些其他缺陷无法得到审核的问题,进而在一定程度上提高了审核结果的可靠度,同时有利于提高学生教材的权威性。
[0090] S5:对各页面对应的插画部分进行观看质量合规审核,其具体审核过程如下:
[0091] D1:对各页面对应的插画进行分辨率检测;
[0092] D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
[0093] 需要说明的是,上述提到的插画主体是指插画中存在的人或物;
[0094] D3:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
[0095] D4:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式 由此计算各页面中各插画主体对应的颜色填充符合度;
[0096] 需要说明的是,本发明对目标教材中各页面的插画进行分辨率检测的目的在于插画的分辨率直接影响插画的清晰度,插画一旦出现清晰度不过关,就会影响观看效果,对各页面的插画进行颜色填充符合度检测的目的在于插画的颜色填充符合度会影响插画的观看美感,插画一旦出现颜色填充符合度不过关,就会降低学生的观看兴趣,影响教材的可读性。
[0097] S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数,其具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为ψ表示为目标教材对应的插画合规指
数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1;
[0098] 本发明实施例通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部分进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,能够从观看体验感出发及时审核出学生教材内容中插画的观看质量不足,为后续学生教材的可读性改进提供有效的依据。
[0099] S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。
[0100] 本发明在对学生教材内容进行合规审核过程中采用智能化的审核方式,其相比较人工肉眼审核,不仅能够大大提高审核速度,还避免了遗漏审核,降低了审核错误的发生率,与此同时还减少了人工审核成本,最大程度上保障了审核精准度,进而有利于提高审核效果,具有较大的实用性。
[0101] 实施例2
[0102] 参照图2所示,本发明提供一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
[0103] 目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0104] 页面信息提取模块,与目标教材页面统计模块连接,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
[0105] 文本合规审核模块,分别与页面信息提取模块和审核数据库连接,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0106] 文本合规指数评价模块,与文本合规审核模块连接,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
[0107] 审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
[0108] 插画观看质量合规审核模块,与页面信息提取模块连接,用于对各页面对应的插画部分进行观看质量合规审核;
[0109] 插画合规指数评价模块,与插画观看质量合规审核模块连接,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
[0110] 目标教材审核判断模块,分别与文本合规指数评价模块和插画合规指数评价模块连接,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
[0111] 实施例3
[0112] 本发明提供一种基于人工智能的学生教材内容审核评价存储介质,所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种基于人工智能的学生教材内容审核评价方法。
[0113] 以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。