首页 > 专利 > 武汉谆教教育咨询中心 > 一种基于人工智能的学生教材内容审核评价方法、系统及存储介质专利详情

一种基于人工智能的学生教材内容审核评价方法、系统及存储介质   0    0

实质审查 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2022-06-24
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2022-11-04
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2042-06-24
基本信息
有效性 实质审查 专利类型 发明专利
申请号 CN202210728919.7 申请日 2022-06-24
公开/公告号 CN115205879A 公开/公告日 2022-10-18
授权日 预估到期日 2042-06-24
申请年 2022年 公开/公告年 2022年
缴费截止日
分类号 G06V30/412G06V30/413G06F40/289G06Q10/06 主分类号 G06V30/412
是否联合申请 独立申请 文献类型号 A
独权数量 1 从权数量 9
权利要求数量 10 非专利引证数量 0
引用专利数量 0 被引证专利数量 0
非专利引证
引用专利 被引证专利
专利权维持 99 专利申请国编码 CN
专利事件 事务标签 公开、实质审查
申请人信息
申请人 第一申请人
专利权人 武汉谆教教育咨询中心 当前专利权人 武汉谆教教育咨询中心
发明人 熊飘 第一发明人 熊飘
地址 湖北省武汉市青山区高新科技园冶金大道12号 邮编 430080
申请人数量 1 发明人数量 1
申请人所在省 湖北省 申请人所在市 湖北省武汉市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
摘要
本发明公开一种基于人工智能的学生教材内容审核评价方法、系统及存储介质,通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部门进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,为后续学生教材的可读性改进提供有效的依据,同时在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,进而在一定程度上提高了审核结果的可靠度,有利于提高学生教材的权威性。
  • 摘要附图
    一种基于人工智能的学生教材内容审核评价方法、系统及存储介质
  • 说明书附图:图1
    一种基于人工智能的学生教材内容审核评价方法、系统及存储介质
  • 说明书附图:图2
    一种基于人工智能的学生教材内容审核评价方法、系统及存储介质
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2022-11-04 实质审查的生效 IPC(主分类): G06V 30/412 专利申请号: 202210728919.7 申请日: 2022.06.24
2 2022-10-18 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于人工智能的学生教材内容审核评价方法,其特征在于,包括以下步骤:
S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
S5:对各页面对应的插画部分进行观看质量合规审核;
S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。

2.根据权利要求1所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述S3中对各页面对应的文本部分进行格式合规审核对应的具体审核过程如下:
A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
A2:分别提取各文字对应的字体和字号;
A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式 计算出各页面对应的格式合规度,其中σi表示为第i个页
面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。

3.根据权利要求2所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述S3中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
B1:对各页面对应的文本部分进行分句划分,得到若干分句;
B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
B3:从各页面对应各分句存在的若干词组中提取出关键词组;
B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为
ηi表示为第i个页面对应的史事表述合规度,ri表示为
第i个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数。

4.根据权利要求3所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述要素参数包括发生时间、发生地点、人物、背景和过程。

5.根据权利要求4所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述S3中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为 ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量。

6.根据权利要求5所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述目标教材对应的文本合规指数评价公式为 表
示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1。

7.根据权利要求1所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述S5中对各页面对应的插画部分进行观看质量合规审核对应的具体审核过程如下:
D1:对各页面对应的插画进行分辨率检测;
D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
D3:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
D4:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式 由此计算各页面中各插画主体对应
的颜色填充符合度。

8.根据权利要求7所述的一种基于人工智能的学生教材内容审核评价方法,其特征在于:所述评价目标教材对应的插画合规指数具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行 对比 ,由 此 评 价目 标教 材 对应的 插 画 合规 指数 ,其评 价公 式 为ψ表示为目标教材对应的插画合规指
数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1。

9.一种基于人工智能的学生教材内容审核评价系统,其特征在于,包括以下模块:
目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
页面信息提取模块,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
文本合规审核模块,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
文本合规指数评价模块,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
插画观看质量合规审核模块,用于对各页面对应的插画部分进行观看质量合规审核;
插画合规指数评价模块,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
目标教材审核判断模块,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。

10.一种基于人工智能的学生教材内容审核评价存储介质,其特征在于:所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1‑8任一项所述的方法。
说明书

技术领域

[0001] 本发明属于学生教材审核评价技术领域,具体而言是一种基于人工智能的学生教材内容审核评价方法、系统及存储介质。

背景技术

[0002] 教材作为开展教学活动,体现教学内容的知识载体,其不仅是教师讲课的主要依据,也是学生获得知识的主要源泉,因此教材的质量直接关系到教学质量,在这种情况下,对学生教材内容进行合规审核显得尤为重要。
[0003] 在实现本申请的过程中,发明人发现现有对学生教材内容的审核评价方式至少存在如下问题:
[0004] 1.当前对学生教材内容的审核方向偏重于文本部分,对其中的插画往往存在一定忽略,特别是插画的观看质量合规审核,这是由于有些插画制作者在进行插画制作时过于随性,导致制作出来的插画容易存在一些不足,例如画面不够清晰、线条不够流畅等,进而影响学生的观看体验感,降低了教材的可读性;
[0005] 2.当前在对学生教材的文本部分进行审核时,只是单纯对文本的用词敏感性进行审核,例如审核文本中是否存在一些违禁词、低俗词等,审核指标过于单一,导致文本中的一些其他缺陷无法得到审核,如格式缺陷、史事表述错误等,进而影响审核结果的可靠度,且一旦存在文本缺陷的教材得到正式使用,也会影响教材的权威性;
[0006] 3.当前在对学生教材内容进行合规审核过程中采用的审核方式大多为人工肉眼审核,一方面降低了审核速度,另一方面容易造成遗漏审核和审核错误,在一定程度上影响了审核精准度,导致审核效果不佳。

发明内容

[0007] 基于此,有必要针对现有对学生教材内容审核评价方式的缺陷,提供一种审核方向全面、审核指标多样化、审核效率高的基于人工智能的学生教材内容审核评价方法、系统及存储介质。
[0008] 第一方面,本发明提供一种基于人工智能的学生教材内容审核评价方法,包括以下步骤:
[0009] S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0010] S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
[0011] S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0012] S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
[0013] S5:对各页面对应的插画部分进行观看质量合规审核;
[0014] S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
[0015] S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。
[0016] 在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行格式合规审核对应的具体审核过程如下:
[0017] A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
[0018] A2:分别提取各文字对应的字体和字号;
[0019] A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
[0020] A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
[0021] A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式 计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。
[0022] 在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
[0023] B1:对各页面对应的文本部分进行分句划分,得到若干分句;
[0024] B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
[0025] B3:从各页面对应各分句存在的若干词组中提取出关键词组;
[0026] B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
[0027] B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
[0028] B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
[0029] B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为ηi表示为第i个页面对应的史事表述合规度,ri表示为第i
个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数。
[0030] 在本发明第一方面的一种能够实现的方式中,所述要素参数包括发生时间、发生地点、人物、背景和过程。
[0031] 在本发明第一方面的一种能够实现的方式中,所述S3中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
[0032] C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
[0033] C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为 ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量。
[0034] 在本发明第一方面的一种能够实现的方式中,所述目标教材对应的文本合规指数评价公式为 表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=
1。
[0035] 在本发明第一方面的一种能够实现的方式中,所述S5中对各页面对应的插画部分进行观看质量合规审核对应的具体审核过程如下:
[0036] D1:对各页面对应的插画进行分辨率检测;
[0037] D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
[0038] D3:对各页面中各插画主体的边缘轮廓线进行流畅度检测;
[0039] D4:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
[0040] D5:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式 由此计算各页面中各插画主体对应的颜色填充符合度。
[0041] 在本发明第一方面的一种能够实现的方式中,所述评价目标教材对应的插画合规指数具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为 ψ表示为目标教材对应的插画合规指数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1。
[0042] 第二方面,本发明提供一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
[0043] 目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0044] 页面信息提取模块,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
[0045] 文本合规审核模块,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0046] 文本合规指数评价模块,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
[0047] 审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
[0048] 插画观看质量合规审核模块,用于对各页面对应的插画部分进行观看质量合规审核;
[0049] 插画合规指数评价模块,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
[0050] 目标教材审核判断模块,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
[0051] 第三方面,本发明提供一种基于人工智能的学生教材内容审核评价存储介质,所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种基于人工智能的学生教材内容审核评价方法。
[0052] 结合上述的所有技术方案,本发明所具备的优点及积极效果为:
[0053] (1)本发明通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部分进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,能够从观看体验感出发及时审核出学生教材内容中插画的观看质量不足,为后续学生教材的可读性改进提供有效的依据。
[0054] (2)本发明在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,有效弥补了现有技术中文本部分审核指标单一造成的对文本中的一些其他缺陷无法得到审核的问题,进而在一定程度上提高了审核结果的可靠度,同时有利于提高学生教材的权威性。
[0055] (3)本发明在对学生教材内容进行合规审核过程中采用智能化的审核方式,其相比较人工肉眼审核,不仅能够大大提高审核速度,还避免了遗漏审核,降低了审核错误的发生率,与此同时还减少了人工审核成本,最大程度上保障了审核精准度,进而有利于提高审核效果,具有较大的实用性。

实施方案

[0059] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060] 实施例1
[0061] 参照图1所示,本发明提供一种基于人工智能的学生教材内容审核评价方法,包括以下步骤:
[0062] S1:将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0063] S2:从各页面的内容中提取各页面对应的文本部分和插画部分;
[0064] S3:对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0065] 上述中对各页面对应的文本部分进行格式合规审核,其具体审核过程如下:
[0066] A1:对各页面对应的文本部分进行文字数量统计,并对统计的各文字按照预设的顺序分别标记为1,2,...,j,...,m;
[0067] A2:分别提取各文字对应的字体和字号;
[0068] A3:将各页面中各文字对应的字体和字号与审核数据库中存储的学生教材文本对应的合规字体和合规字号进行匹配,从中统计匹配成功的文字数量,并将匹配成功的文字记为符合文字,此时获取各页面中各符合文字的编号,可以记为1,2,...,k,...,z,同时解析各符合文字对应的符合类型,其中符合类型包括字体符合、字号符合和双重符合;
[0069] 在一个具体实施例中,解析各符合文字对应的符合类型,其具体解析方式为若某文字对应的字体和字号与学生教材文本对应的合规字体和合规字号均匹配成功,则该文字对应的符合类型为双重符合,若某文字只有字体匹配成功,则该文字对应的符合类型为字体符合,若某文字只有字号匹配成功,则该文字对应的符合类型为字号符合;
[0070] A4:将各页面中各符合文字对应的符合类型与审核数据库中存储的各种符合类型对应的符合因子进行比对,从中筛选出各页面中各符合文字对应的符合因子;
[0071] A5:将各页面中存在的符合文字数量和各符合文字对应的符合度代入格式合规度计算公式 计算出各页面对应的格式合规度,其中σi表示为第i个页面对应的格式合规度,ωik表示为第i个页面中第k个符合文字对应的符合因子,mi表示为第i个页面存在的文字数量,zi表示为第i个页面存在的符合文字数量。
[0072] 上述格式合规度计算公式中符合文字对应的符合因子越大,符合文字数量越多,格式合规度越大;
[0073] 需要说明的是,上述中对目标教材的文本部分进行格式合规审核,其目的在于学生教材中文字的字体和字号直接影响学生对文字的辨认能力,例如有些字体由于笔画过于特殊,导致无法直观辨认文字,有些字号由于过小也无法直观辨认文字,如果忽略对文本的格式合规审核,就容易出现一些文字采用不合格的字体和字号进行显示,进而由于文字无法直观辨认,不仅影响学生的理解力,还影响学生的视力。
[0074] 上述中对各页面对应的文本部分进行史事表述合规审核对应的具体审核过程如下:
[0075] B1:对各页面对应的文本部分进行分句划分,得到若干分句;
[0076] B2:将各页面划分的各分句进行中文分词处理和去停用词处理,得到若干词组;
[0077] B3:从各页面对应各分句存在的若干词组中提取出关键词组;
[0078] B4:将各页面对应各分句中提取的关键词组与审核数据库中各种历史事件信息对应的关键词组进行匹配,若某页面对应某分句中提取的关键词组匹配成功,表明该分句涉及历史事件,则将该分句记为史事关联分句,并将史事关联分句对应关联的历史事件记为特定历史事件,此时统计各页面中存在的史事关联分句数量,并识别各史事关联分句对特定历史事件的涉及要素参数;
[0079] B5:将各页面中各史事关联分句对应的特定历史事件及对特定历史事件的涉及表述参数与审核数据库中各种历史事件所属各要素参数的真实表述信息进行比对,其中要素参数包括发生时间、发生地点、人物、背景和过程,从中筛选出各页面中各史事关联分句对应特定历史事件所属涉及要素参数的真实表述信息;
[0080] B6:将各页面中各史事关联分句对特定历史事件的涉及要素参数与该分句对应特定历史事件所属涉及要素参数的真实表述信息进行匹配,从中统计匹配成功的史事关联分句数量;
[0081] B7:将各页面中各匹配成功的史事关联分句对应的涉及要素参数与预设的各种要素参数对应的合规权重值进行对比,从中提取出各页面中各匹配成功的史事关联分句对应的合规权重值,从而据此统计各页面对应的史事表述合规度,其计算公式为ηi表示为第i个页面对应的史事表述合规度,ri表示为第i
个页面中匹配成功的史事关联分句数量,Ri表示为第i个页面存在的史事关联分句数量,λid表示为第i个页面中第d个匹配成功的史事关联分句对应的合规权重值,d表示为匹配成功的史事关联分句编号,d=1,2,...,f,e表示为自然常数;
[0082] 上述史事表述合规度计算公式中,匹配成功的史事关联分句数量越多,各匹配成功的史事关联分句对应的合规权重值越大,史事表述合规度越大;
[0083] 需要说明的是,对目标教材的文本部分进行史事表述合规度审核的目的在于:学生教材中史事表述的真实性会教材的权威性,如果不对文本部分的史事表述进行审核,就难以发现史事表述中的错误部分,这样的教材一旦投入使用,会严重降低教材的权威性,进而给学生错误的引导。
[0084] 上述中对各页面对应的文本部分进行用词合规审核对应的具体审核过程如下:
[0085] C1:统计各页面中存在的词组总数量,并将各页面中存在的各词组与审核数据库中存储的敏感词组集合进行匹配,若某词组匹配成功,则将该词组记为重点词组,由此统计各页面中存在的重点词组数量;
[0086] 上述中审核数据库中存储的敏感词组集合包括违禁词、低俗词、违规词等;
[0087] C2:将各页面中存在的重点词组数量与词组总数量进行对比,计算各页面对应的用词合规度,其计算公式为 ξi表示为第i个页面对应的用词合规度,xi表示为第i个页面存在的重点词组数量,Xi表示为第i个页面中存在的词组总数量,其中各页面中存在的重点词组数量越少,该页面对应的用词合规度越大;
[0088] S4:基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数,其评价公式为表示为目标教材对应的文本合规指数,α1、α2、α3分别表示为格式合规度、史事表述合规度、用词合规度对应的占比系数,且α1+α2+α3=1;
[0089] 本发明实施例在对学生教材的文本部分进行审核时,综合了文本部分的格式合规审核、史事表述合规审核和用词合规审核,通过丰富审核指标,实现了文本部分的全面多方位审核,有效弥补了现有技术中文本部分审核指标单一造成的对文本中的一些其他缺陷无法得到审核的问题,进而在一定程度上提高了审核结果的可靠度,同时有利于提高学生教材的权威性。
[0090] S5:对各页面对应的插画部分进行观看质量合规审核,其具体审核过程如下:
[0091] D1:对各页面对应的插画进行分辨率检测;
[0092] D2:对各页面对应的插画进行插画主体识别,并分别提取各插画主体的边缘轮廓线和色彩填充轮廓线;
[0093] 需要说明的是,上述提到的插画主体是指插画中存在的人或物;
[0094] D3:将各页面中各插画主体的边缘轮廓线与色彩填充轮廓线进行重合对比,从中统计重合轮廓线长度;
[0095] D4:根据各页面中各插画主体的边缘轮廓线获取各页面中各插画主体对应的边缘轮廓线长度,进而将其与各页面中各插画主体对应的重合轮廓线长度进行对比,通过颜色填充符合度计算公式 由此计算各页面中各插画主体对应的颜色填充符合度;
[0096] 需要说明的是,本发明对目标教材中各页面的插画进行分辨率检测的目的在于插画的分辨率直接影响插画的清晰度,插画一旦出现清晰度不过关,就会影响观看效果,对各页面的插画进行颜色填充符合度检测的目的在于插画的颜色填充符合度会影响插画的观看美感,插画一旦出现颜色填充符合度不过关,就会降低学生的观看兴趣,影响教材的可读性。
[0097] S6:基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数,其具体评价过程为将各页面对应的插画分辨率和各插画主体对应的颜色填充符合度分别与预设的合规插画分辨率和合规颜色填充符合度进行对比,由此评价目标教材对应的插画合规指数,其评价公式为ψ表示为目标教材对应的插画合规指
数,χi表示为第i个页面对应的插画分辨率,υiu表示为第i个页面中第u个插画主体对应的颜色填充符合度,u表示为插画主体编号,u=1,2,...,w,χ0、υ0分别表示为预设的合规插画分辨率、合规颜色填充符合度,β1、β2分别表示为插画分辨率、插画颜色填充符合度对应的占比系数,且β1+β2=1;
[0098] 本发明实施例通过对待进行审核的学生电子教材进行页面数量统计,并从各页面的内容中提取文本部分和插画部分,进而分别对各页面的文本部分和插画部分进行合规审核,从而基于审核结果判断目标教材内容是否审核通过,实现了学生教材内容的双重合规审核,扩大了学生教材内容的审核方向,能够从观看体验感出发及时审核出学生教材内容中插画的观看质量不足,为后续学生教材的可读性改进提供有效的依据。
[0099] S7:将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,若目标教材对应的文本合规指数和插画合规指数均大于或等于预设的文本合规指数阈值、插画合规指数阈值,则判断目标教材内容审核通过,反之则判断目标教材内容审核不通过。
[0100] 本发明在对学生教材内容进行合规审核过程中采用智能化的审核方式,其相比较人工肉眼审核,不仅能够大大提高审核速度,还避免了遗漏审核,降低了审核错误的发生率,与此同时还减少了人工审核成本,最大程度上保障了审核精准度,进而有利于提高审核效果,具有较大的实用性。
[0101] 实施例2
[0102] 参照图2所示,本发明提供一种基于人工智能的学生教材内容审核评价系统,包括以下模块:
[0103] 目标教材页面统计模块,用于将待进行审核的学生电子教材记为目标教材,进而统计目标教材中存在的页面数量,并将各页面分别编号为1,2,...,i,...,n;
[0104] 页面信息提取模块,与目标教材页面统计模块连接,用于从各页面的内容中提取各页面对应的文本部分和插画部分;
[0105] 文本合规审核模块,分别与页面信息提取模块和审核数据库连接,用于对各页面对应的文本部分进行格式合规审核、史事表述合规审核和用词合规审核;
[0106] 文本合规指数评价模块,与文本合规审核模块连接,用于基于目标教材中各页面对应文本部分的格式合规审核结果、史事表述合规审核结果和用词合规审核结果评价目标教材对应的文本合规指数;
[0107] 审核数据库,用于存储学生教材文本对应的合规字体和合规字号,存储各种符合类型对应的符合因子,存储各种历史事件信息对应的关键词组,存储各种历史事件所属各要素参数的真实表述信息,并存储敏感词组集合;
[0108] 插画观看质量合规审核模块,与页面信息提取模块连接,用于对各页面对应的插画部分进行观看质量合规审核;
[0109] 插画合规指数评价模块,与插画观看质量合规审核模块连接,用于基于目标教材中各页面对应插画部分的观看质量合规审核结果评价目标教材对应的插画合规指数;
[0110] 目标教材审核判断模块,分别与文本合规指数评价模块和插画合规指数评价模块连接,用于将目标教材对应的文本合规指数和插画合规指数分别与预设的文本合规指数阈值和插画合规指数阈值进行对比,并根据对比结果判断目标教材内容是否审核通过。
[0111] 实施例3
[0112] 本发明提供一种基于人工智能的学生教材内容审核评价存储介质,所述存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种基于人工智能的学生教材内容审核评价方法。
[0113] 以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

附图说明

[0056] 利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
[0057] 图1为本发明的方法实施步骤流程图;
[0058] 图2为本发明的系统模块连接示意图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号