首页 > 专利 > 杭州电子科技大学 > 一种基于门控三塔的智能制造装备故障预测方法专利详情

一种基于门控三塔的智能制造装备故障预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-07-22

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-11-26

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-04-01

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-07-22

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202110830568.6	申请日	2021-07-22
公开/公告号	CN113626597B	公开/公告日	2022-04-01
授权日	2022-04-01	预估到期日	2041-07-22
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F16/35 、G06K9/00 、G06K9/62 、G06N3/08	主分类号	G06F16/35
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	3
权利要求数量	4	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	1	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	张新、陈嘉、陈涛、王东京、石云海	第一发明人	张新
地址	浙江省杭州市钱塘新区白杨街道2号大街1158号	邮编	310018
申请人数量	1	发明人数量	5
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于门控三塔的智能制造装备故障预测方法，包括：S1通道塔编码器；S2带有多尺度聚合模块的滑窗塔编码器；S3带有跨塔注意力模块的文本塔编码器；S4门控模块。本发明首先将通道嵌入矩阵输入到通道塔编码器，得到通道特征；将时序嵌入矩阵输入到带有多尺度聚合模块的滑窗塔编码器，得到聚合时序特征；进一步，将文本表示输入至文本塔编码器得到文本特征并将文本特征和时序特征输入至跨塔注意力模块得到加权文本特征；最后通过门控模块融合通道特征、聚合时序特征和加权文本特征进行故障类别预测；通过计算交叉熵损失优化参数，使得模型能够动态地自适应融合多台智能制造装备的三种特征，从而提升故障预测的准确率。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4
说明书附图：图5

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-04-01	授权
2	2021-11-26	实质审查的生效	IPC(主分类): G06F 16/35 专利申请号: 202110830568.6 申请日: 2021.07.22
3	2021-11-09	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于门控三塔的智能制造装备故障预测方法，其特征在于包括如下步骤：
S
1.数据采集：获取一定天数内多台同类智能制造装备的由传感器采集的相关数值数据集运行日志文本数据集和装备
状态数据集
其中为第s台智能制造装备在第d天的K类数值数据，T为数据总天数，D为故障预测日期，N为智能制造装备总台数；
为第s台智能制造装备在第d天的多条日志文本数据；
为第s台智能制造装备在第D天第b状态的真实标记，若第s台智能制造装备的状态类别属于b则为1，否则为0，B为状态总数；并用表示第s台智能制造装备的所有数值数据，表示第s台智能制造装备第d天的所有文本数据；
S
2.对数值数据及文本数据进行变换，得到通道嵌入矩阵、时序嵌入矩阵及句嵌入向量，具体包括以下子步骤：
S
21.将第s台智能制造装备的转置数值数据输入至线性层，获得通道嵌入矩阵S
22.将第s台智能制造装备的原始数值数据输入至线性层，并经过位置编码获得时序嵌入矩阵
S
23.将第s台智能制造装备的文本数据输入至BERT模型获得每条文本数据的句嵌入向量；
S
24.对每天的句嵌入向量分别采用最小值、平均值、最大值池化操作获得文本表示S
3.将通道嵌入矩阵输入至通道塔编码器，得到数值数据的通道特征，通道塔c
编码器由L个通道编码层构成，具体包括以下子步骤：
S
31.对层通道编码层提取的通道特征进行归一化处理
S
32.对步骤S31得到的归一化特征进行多头注意力层特征提取，该层采用残差结构，其计算公式为：
多头注意力层的具体操作包括以下子步骤：
SU
1.通道特征和参数矩阵相乘得到第a个自注意力SAa(·)的输入嵌入矩阵映射的查询矩阵qa、键矩阵ka和值矩阵va；
SU2 .通过归一化指数sof tmax函数计算得到自注意力权重矩阵
为映射矩阵内每个向量的维度大小；
SU
3.自注意力权重矩阵sa和值矩阵va相乘得到
SU
4.对各注意力层得到的特征进行拼接，并乘参数矩阵得到MSA层的输出特征S
33.对步骤S32所得到的特征进行归一化处理
S
34.将归一化特征输入至多层感知机进行特征提取，其结果即为第层通道编码特征，其计算公式为：
S
35.第层通道编码特征输入至第层通道编码层，重复步骤S31‑S34；
S
4.滑窗塔编码器对时序嵌入矩阵进行多层多尺度特征提取得到多尺度时序特征具体包括以下子步骤：
S
41.对层滑窗编码层提取的时序特征进行归一化处理
S
42.对归一化后的特征采用滑窗掩膜注意力层提取特征，当为奇数时，执行以下操作：
SN
1.第个滑窗掩膜注意力层以时间单位大小的滑窗将时序特征进行非重叠均分且SN
2.采用不大于时间单位大小的滑窗将边缘时序特征完整包括；
SN
3.在该层滑窗内进行掩膜自注意力计算，将多头注意力计算步骤中的自注意力权重矩阵sa上三角元素置0；
SN
4.使用固定滑窗进行掩膜自注意力计算，并采用残差结构计算本层的输出时序特征当为偶数时，执行以下操作：
SN
5.第个滑窗掩膜注意力层先将第个滑窗掩膜注意力层的所有滑窗以时间单位大小进行移动；
SN
6.采用不大于时间单位大小的滑窗将边缘时序特征完整包括；
SN
7.在该层滑窗内进行掩膜自注意力计算，将多头注意力计算步骤中的自注意力权重矩阵sa上三角元素置0；
SN
8.使用固定滑窗进行掩膜自注意力计算，并采用残差结构计算
S44 .对归一化后的时序特征采用多层感知机提取特征，
t
S
45.滑窗编码层输出的多尺度时序特征 L进行多尺度聚合得
到聚合时序特征并输出，该特征包含多尺度的全局与局部时序信息，计算公式为：
S
5.将文本表示输入至文本塔编码器得到文本特征并将文本特征和时序特征输入至跨塔注意力模块得到加权文本特征,具体包括以下子步骤：
S
51.对层输出的文本特征进行归一化
S
52.通过多头注意力层对归一化后的文本特征提取特征，计算公式为：
S
53.对步骤S52计算得到的文本特征进行归一化
S
54.对归一化后的文本特征进行多层感知机特征提取，计算公式为：
S
6.采用门控模块融合通道特征、聚合时序特征和加权文本特征计算输出预测故障类别概率向量，具体包括以下子步骤：
S
61.将全局时序特征输入至全连接层得到线性映射后的全局时序特征
S
62.将全局时序特征进行转置得到对齐的特征
S
63.利用矩阵相乘操作和Softmax(·)函数得到文本‑时序注意力权重计算公式为：
其中，FC(·)为全连接层；
S
64.输出采用文本‑时序注意力权重计算的加权文本特征：
S
65.根据三种特征加权融合，得到预测结果，具体包括以下子步骤：
SW
1.将通道特征聚合时序特征和加权文本特征输入到门控模块；
SW
2.门控层G通过自适应权重对三种特征进行加权融合得到门控特征
SW
3.将门控特征输入至全连接层FC得到第s台智能制造装备预测故障类别概率向量ys，计算公式为：
S
7.根据预测故障类别概率向量计算交叉熵损失，该步骤只在训练过程中使用，用以引导模型能够准确预测智能制造装备故障类别。

2.根据权利要求1所述的一种基于门控三塔的智能制造装备故障预测方法，其特征在于，步骤S42通过在多个不重叠相邻时序滑窗内进行掩膜注意力计算,实现高效的多尺度时序特征提取,并通过滑动窗口建立多个滑窗内时序信息交流机制。

3.根据权利要求1所述的一种基于门控三塔的智能制造装备故障预测方法，其特征在于，步骤S5跨塔注意力模块，通过计算全局时序特征和文本特征的注意力权重实现模型对于文本‑时序相关性的端到端学习。

4.根据权利要求1所述的一种基于门控三塔的智能制造装备故障预测方法，其特征在于，步骤S6采用门控模块融合通道特征、聚合时序特征和加权文本特征，使用多特征融合向量方法进行故障预测，提高模型对故障预测的准确率及模型的鲁棒性。

说明书

技术领域

[0001] 本发明涉及智能制造的预测性维护领域，针对利用智能制造装备运行时传感器采集的数值数据和运行日志的文本数据进行预测故障类别的问题，结合数值数据的通道特征、时间特征和日志数据的文本特征，提出了基于门控三塔Transformer的智能制造装备故障预测方法。

背景技术

[0002] 近年来，国家不断出台鼓励性政策支持智能制造，智能制造已成为制造业的重要发展趋势。各地智能制造产业的兴起，涌现了一批智能制造企业与产业园区，相应的系统设备也不断规模化与复杂化，进而对智能制造装备的运维要求更高。在生产过程中智能制造装备可能会发生故障，若没有提前制定处理方法或维修策略则可能影响产品的质量和生产效率甚至造成巨大的经济损失。对此，引入预测性维护中的故障预测技术，根据智能制造装备的运行状态数据预测其未来可能的故障模式，并预先制定预测性维护计划。故障预测技术以智能制造装备运行时传感器采集的数值数据和运行日志的文本数据等作为输入，通过提取数据特征并进行分析，输出预测的故障类别。近年来，深度学习快速发展极大促进了数据特征提取和分析方法的发展，有望将其应用于故障预测技术。

[0003] 目前，国内外学者在故障预测领域做出了很多有价值的研究成果。基于统计分析的故障预测技术(如灰色理论、独立元分析方法等)通过统计历史运行数据来分析预测智能制造装备未来的运行状态，但由于采用了维度线性的约束，其难以适应真实情况中复杂的非线性系统。基于信号处理的故障预测技术(如小波变换法、谱分析方法等)难以长时间跟踪智能制造装备的运行数据序列，容易导致预测性能下降。基于深度学习的故障预测技术(如卷积神经网络、循环神经网络等)能够有效地在历史运行数据中提取重要的特征信息来进行故障预测，适用于不确定的和复杂的智能制造装备系统。近期，源于自然语言处理领域的Transformer模型风靡于深度学习领域，其多头注意力机制可被用于提取运行数据中多样性的关键特征信息。

[0004] 现有的故障预测方法仍然存在许多不足：首先，很多方法仅利用了传感器获取的数值数据的时序特征，而没有充分利用通道特征，基于卷积提取通道特征的方法需要繁复地设计感受野且无法建立全局的通道关联关系；其次，提取时序特征时往往固定了时序尺度，没有利用局部的时序信息，通过堆叠卷积层的方法容易导致计算开销过大；此外，现有方法处理日志文本数据时往往需手工进行特征提取并进一步分析预测故障类别，缺少能够有效融合数值数据和文本数据特征的端到端训练方法。

发明内容

[0005] 本发明针对现有故障预测技术对传感器采集的数值数据和运行日志的文本数据特征提取和融合的不足，提出了一种基于门控三塔Transformer的智能制造装备故障预测方法。首先，设计了滑窗掩膜注意力机制进行对多尺度时序特征进行提取并利用多尺度聚合模块进行时序特征聚合，不仅能够在多个滑窗内应用掩膜注意力，减小模型的计算开销，而且能够增加模型对局部时序特征信息的提取及表达能力；然后，在提取文本特征后，采用跨塔注意力机制学习文本‑时序注意力权重，有效地实现端到端的智能制造装备故障预测。

[0006] 本发明采用由多个编码器组成的Transformer架构。首先，通道嵌入矩阵输入到通道塔编码器，得到数值数据的通道特征；然后，将时序嵌入矩阵输入到带有多尺度聚合模块的滑窗塔编码器，得到聚合时序特征，该特征包含多尺度的全局与局部时序信息；进一步，将文本表示输入至文本塔编码器得到文本特征并将文本特征和时序特征输入至跨塔注意力模块得到加权文本特征，使模型能倾向利用故障信息相关的文本特征进行预测；最后，本发明采用门控模块融合通道特征、聚合时序特征和加权文本特征进行预测故障类别，使得模型能够动态地自适应融合多台智能制造装备的三种特征，从而提升智能制造装备故障预测的准确率。

[0007] 本发明首先获取一定天数内多台同类智能制造装备的由传感器采集的相关数值数据集运行日志文本数据集和装备状态数据集其中为第s台智能制造装备在第d天的K类数值数据(如填料温
度、压力、流量等)，T为数据总天数，D为故障预测日期，N为智能制造装备总台数；为第s台智能制造装备在第d天的多条日志文本数据；为第s台智能制造装备在第D天第b状态的真实标记，若第s台智能制造装备的状态类别属于b则为1，否则为0，B为状态总数(如状态正常、装备某部件发生故障等)。并用表示第s台智能制造装备的所有数值数据，表示第s台智能制造装备第d天的所有文本数据。

[0008] 本发明具体实现包括如下步骤：

[0009] S1.数据采集：获取一定天数内多台同类智能制造装备的由传感器采集的相关数值数据集运行日志文本数据集和装备状态数据集

[0010] 其中为第s台智能制造装备在第d天的K类数值数据，T为数据总天数，D为故障预测日期，N为智能制造装备总台数；

[0011] 为第s台智能制造装备在第d天的多条日志文本数据；

[0012] 为第s台智能制造装备在第D天第b状态的真实标记，若第s台智能制造装备的状态类别属于b则为1，否则为0，B为状态总数；并用表示第s台智能制造装备的所有数值数据，表示第s台智能制造装备第d天的所有文本数据；

[0013] S2.对数值数据及文本数据进行变换，得到通道嵌入矩阵、时序嵌入矩阵及句嵌入向量，具体包括以下子步骤：

[0014] S21.将第s台智能制造装备的转置数值数据输入至线性层，获得通道嵌入矩阵[0015] S22.将第s台智能制造装备的原始数值数据输入至线性层，并经过位置编码获得时序嵌入矩阵

[0016] S23.将第s台智能制造装备的文本数据输入至BERT模型获得每条文本数据的句嵌入向量；

[0017] S24.对每天的句嵌入向量分别采用最小值、平均值、最大值池化操作获得文本表示

[0018] S3.将通道嵌入矩阵输入至通道塔编码器，得到数值数据的通道特征，通c道塔编码器由L个通道编码层构成，具体包括以下子步骤：

[0019] S31.对层通道编码层提取的通道特征进行归一化处理

[0020] S32.对步骤S31得到的归一化特征进行多头注意力层特征提取，该层采用残差结构，其计算公式为：

[0021]

[0022] 多头注意力层的具体操作包括以下子步骤：

[0023] SU1.通道特征和参数矩阵相乘得到第a个自注意力SAa(·)的输入嵌入矩阵映射的查询矩阵qa、键矩阵ka和值矩阵va；

[0024] SU2.通过归一化指数softmax函数计算得到自注意力权重矩阵为映射矩阵内每个向量的维度大小；

[0025] SU3.自注意力权重矩阵sa和值矩阵va相乘得到

[0026] SU4.对各注意力层得到的特征进行拼接，并乘参数矩阵得到MSA层的输出特征[0027] S33.对步骤S32所得到的特征进行归一化处理

[0028] S34.将归一化特征输入至多层感知机进行特征提取，其结果即为第层通道编码特征，其计算公式为：

[0029]

[0030] S35.第层通道编码特征输入至第层通道编码层，重复步骤S31‑S34；

[0031] S4.滑窗塔编码器对时序嵌入矩阵进行多层多尺度特征提取得到多尺度时序特征具体包括以下子步骤：

[0032] S41.对层滑窗编码层层提取的时序特征进行归一化处理

[0033] S42.对归一化后的特征采用滑窗掩膜注意力层提取特征，当为奇数时，执行以下操作：

[0034] SN1.第个滑窗掩膜注意力层以时间单位大小的滑窗将时序特征进行非重叠均分且

[0035] SN2.采用不大于时间单位大小的滑窗将边缘时序特征完整包括；

[0036] SN3.在该层滑窗内进行掩膜自注意力计算，将多头注意力计算步骤中的自注意力权重矩阵sa上三角元素置0；

[0037] SN4.使用固定滑窗进行掩膜自注意力计算，并采用残差结构计算本层的输出时序特征

[0038] 当为偶数时，执行以下操作：

[0039] SN5.第个滑窗掩膜注意力层先将第个滑窗掩膜注意力层的所有滑窗以时间单位大小进行移动；

[0040] SN6.采用不大于时间单位大小的滑窗将边缘时序特征完整包括；

[0041] SN7.在该层滑窗内进行掩膜自注意力计算，将多头注意力计算步骤中的自注意力权重矩阵sa上三角元素置0；

[0042] SN8.使用固定滑窗进行掩膜自注意力计算，并采用残差结构计算本层的输出时序特征

[0043] S43.对步骤S42提取的时序特征进行归一化处理

[0044] S44 .对归一化后的时序特征采用多层感知机提取特征，

[0045] S45.滑窗编码层输出的多尺度时序特征 Lt进行多尺度聚合得到聚合时序特征并输出，该特征包含多尺度的全局与局部时序信息，计算公式为：

[0046]

[0047] S5.将文本表示输入至文本塔编码器得到文本特征并将文本特征和时序特征输入至跨塔注意力模块得到加权文本特征,具体包括以下子步骤：

[0048] S51.对层输出的文本特征进行归一化

[0049] S52.通过多头注意力层对归一化后的文本特征提取特征，计算公式为：

[0050] S53.对步骤S52计算得到的文本特征进行归一化

[0051] S54.对归一化后的文本特征进行多层感知机特征提取，计算公式为：

[0052] S6.采用门控模块融合通道特征、聚合时序特征和加权文本特征计算输出预测故障类别概率向量，具体包括以下子步骤：

[0053] S61.将全局时序特征输入至全连接层得到线性映射后的全局时序特征[0054] S62.将全局时序特征进行转置得到对齐的特征

[0055] S63.利用矩阵相乘操作和Softmax(·)函数得到文本‑时序注意力权重计算公式为：

[0056]

[0057] 其中，FC(·)为全连接层；

[0058] S64.输出采用文本‑时序注意力权重计算的加权文本特征：

[0059] S65.根据三种特征加权融合，得到预测结果，具体包括以下子步骤：

[0060] SW1.将通道特征聚合时序特征和加权文本特征输入到门控模块；

[0061] SW2.门控层G通过自适应权重对三种特征进行加权融合得到门控特征[0062] SW3.将门控特征输入至全连接层FC得到第s台智能制造装备预测故障类别概率向量ys，计算公式为：

[0063]

[0064] S7.根据预测故障类别概率向量计算交叉熵损失，该步骤只在训练过程中使用，用以引导模型能够准确预测智能制造装备故障类别。

[0065] 作为优选，步骤S42通过在多个不重叠相邻时序滑窗内进行掩膜注意力计算,实现高效的多尺度时序特征提取,并通过滑动窗口建立多个滑窗内时序信息交流机制。

[0066] 一种滑窗掩膜注意力层，通过在多个不重叠相邻时序滑窗内进行掩膜注意力计算实现高效的多尺度时序特征提取并通过滑动窗口建立多个滑窗内时序信息交流机制；同时，本发明设计了多尺度聚合模块作为聚合多尺度时序特征的功能模块。多尺度时序特征提取与多尺度聚合的计算公式为：

[0067]

[0068] 作为优选，步骤S5跨塔注意力模块，通过计算全局时序特征和文本特征的注意力权重实现模型对于文本‑时序相关性的端到端学习。

[0069] 作为优选，步骤S6采用门控模块融合通道特征、聚合时序特征和加权文本特征，使用多特征融合向量方法进行故障预测，提高模型对故障预测的准确率及模型的鲁棒性。

[0070] 本发明门控三塔Transformer架构由通道塔编码器、带有多尺度聚合模块的滑窗塔编码器、带有跨塔注意力模块的文本塔编码器和门控层构成。通道塔编码器、滑窗塔编码器和文本塔编码器能够分别有效地提取数值数据的通道特征、聚合时序特征和文本数据的加权文本特征，门控层利用动态权重对三种特征进行加权融合，使得模型能够针对多台智能制造装备的数据进行特征自适应，从而提升预测智能制造装备故障类别的准确性。

实施方案

[0076] 实施例1

[0077] 本发明提出基于门控三塔Transformer的智能制造装备故障预测技术。如图1所示，整体架构由通道塔编码器、带有多尺度聚合模块的滑窗塔编码器、带有跨塔注意力模块的文本塔编码器和门控模块构成。首先，将通道嵌入矩阵输入到通道塔编码器，得到数值数据的通道特征；然后，将时序嵌入矩阵输入到带有多尺度聚合模块的滑窗塔编码器，得到聚合时序特征，该特征包含多尺度的全局与局部时序信息；进一步，将文本表示输入至文本塔编码器得到文本特征并将文本特征和时序特征输入至跨塔注意力模块得到加权文本特征，使模型能倾向利用故障信息相关的文本特征进行预测；接着，采用门控模块融合通道特征、聚合时序特征和加权文本特征计算输出预测故障类别概率向量；最后，根据预测故障类别概率向量计算交叉熵损失，该步骤只在训练过程中使用，用以引导模型能够准确预测智能制造装备故障类别。

[0078] 本发明首先获取一定天数内多台同类智能制造装备的由传感器采集的相关数值数据集运行日志文本数据集和装备状态数据集其中为第s台智能制造装备在第d天的K类数值数据(如填料温
度、压力、流量等)，T为数据总天数，D为故障预测日期，N为智能制造装备总台数；为第s台智能制造装备在第d天的多条日志文本数据；为第s台智能制造装备在第D天第b状态的真实标记，若第s台智能制造装备的状态类别属于b则为1，否则为0，B为状态总数(如状态正常、装备某部件发生故障等)。并用表示第s台智能制造装备的所有数值数据，表示第s台智能制造装备第d天的所有文本数据。

[0079] 接下来结合附图具体阐述实施步骤。

[0080] 步骤(1).如图1所示，将第s台智能制造装备的转置数值数据输入至线性层，获得通道嵌入矩阵将第s台智能制造装备的原始数值数据输入至线性层，并经过位置编码获得时序嵌入矩阵如图2所
示，通道嵌入矩阵和时序嵌入矩阵分别为数值数据在通道和时序内的嵌入表示。如图3所示，将第s台智能制造装备的日志文本数据输入至BERT(Bidirectional Encoder Representations from Transformers)获得每条文本的句嵌入向量，并对每天的句嵌入向量分别采用最小值、平均值、最大值池化操作获得文本表示

[0081] 步骤(2).如图1所示将通道嵌入矩阵输入至通道塔编码器，通道塔编码器c由L 个通道编码层构成，对通道嵌入矩阵进行多层特征提取得到通道特征通道编码层由两个具有残差结构的子层构成，第一个子层由层归一化操作和多头注意力层组成，第二个子层由层归一化操作和多层感知机组成，第个通道编码层中的通道特征提取的计算公式为：

[0082]

[0083] 其中 LN(·)为层归一化操作，MLP(·)为多层感知机，MSA(·)为多头注意力，计算步骤为：

[0084]

[0085] 其中为参数矩阵，qakava为第a个自注意力SAa(·)的输入嵌入矩阵映射的查询矩阵、键矩阵和值矩阵，sa为自注意力权重矩阵，为映射矩阵内每个向量的维度大小，Softmax(·)为归一化指数函数，A为自注意力总数，[·,…,·]为拼接操作。
c

[0086] 通道塔编码器的输出为第L 个通道编码层输出的通道特征：t

[0087] 步骤(3).如图1,所示将时序嵌入矩阵输入至带有多尺度聚合模块M的滑窗塔编码器，滑窗塔编码器由个滑窗编码层构成，对时序嵌入矩阵进行多层多尺度特征提取得到多尺度时序特征利用多尺度聚合模块对多尺度时序特征进行多尺度聚合得到聚合时序特

[0088] 本发明提出了一种滑窗掩膜注意力层，通过在多个不重叠相邻时序滑窗内进行掩膜注意力计算实现高效的多尺度时序特征提取并通过滑动窗口建立多个滑窗内时序信息交流机制；同时，本发明设计了多尺度聚合模块作为聚合多尺度时序特征的功能模块。多尺度时序特征提取与多尺度聚合的计算公式为：

[0089]

[0090] 步骤(3.1).滑窗编码层由两个具有残差结构的子层构成，第一个子层由层归一化操作和滑窗掩膜注意力层组成，第二个子层由层归一化操作和多层感知机组成。如图4所示，当为奇数时，第个滑窗掩膜注意力层先以时间单位大小的滑窗将时序特征进行非重叠均分且然后用不大于时间单位大小的滑窗将边缘时序特征完整包括。当为偶数时，第个滑窗掩膜注意力层先将第个滑窗掩膜注意力层的所有滑窗以时间单位大小进行移动，然后用不大于时间单位大小的滑窗将边缘时序特征完整包括。每个滑窗掩膜注意力层在该层滑窗内进行掩膜自注意力计算，将多头注意力计算步骤中的自注意力权重矩阵sa上三角元素置0即为掩膜自注意力计算步骤。当为奇数，第个和第个通道编码层中的通道特征提取的计算公式为：

[0091]

[0092] 其中, RW‑MSA(·)为奇数滑窗掩膜注意力层使用固定滑窗进行掩膜自注意力计算，SW‑MSA(·)为偶数滑窗掩膜注意力层使用移动后的滑窗进行掩膜自注意力计算。

[0093] 步骤(3.2).多尺度聚合模块Mt由矩阵拼接操作构成，对第偶数个和Lt个滑窗编码t层输出的多尺度时序特征 L 进行多尺度聚合得到聚合时序特征
并输出，计算公式为：

[0094]

[0095] 步骤(4).将文本表示输入至带有跨塔注意力模块的文本塔编码器，文本塔编码器由个文本编码层构成，对文本表示进行多层特征提取得到文本特征[0096] 步骤(4.1).文本编码层由两个具有残差结构的子层构成，第一个子层由层归一化操作和多头注意力层组成，第二个子层由层归一化操作和多层感知机组成,第个文本编码层中的文本特征提取的计算公式为：

[0097]

[0098] 其中

[0099] 步骤(4.2).如图5所示，跨塔注意力模块利用全局时序特征和文本特征计算文本‑时序注意力权重并对文本特征进行加权得到加权文本特征先将全局时序特征输入至全连接层得到线性映射后的全局时序特征将其转置得到以对齐时序。利用矩阵
相乘操作和Softmax(·)函数得到文本‑时序注意力权重计算公式为：

[0100]

[0101] 其中FC(·)为全连接层。

[0102] 跨塔注意力模块的输出为利用文本‑时序注意力权重计算的加权文本特征：

[0103] 一种跨塔注意力模块，通过计算全局时序特征和文本特征的注意力权重实现模型对于文本‑时序相关性的端到端学习。文本特征提取和文本特征加权计算公式为：

[0104]

[0105] 步骤(5).将通道特征聚合时序特征和加权文本特征输入到门控模块。门控层G通过自适应权重对三种特征进行加权融合得到门控特征计算公式为：

[0106]

[0107] 将门控特征输入至全连接层得到第s台智能制造装备预测故障类别概率向量计算公式为：

[0108]

[0109] 步骤(6).计算损失，并对门控三塔Transformer进行优化。为了提高故障类别与真实装备状态的一致性，本发明采用交叉熵损失loss，计算公式为

[0110]

[0111] 其中ys,b为第s台智能制造装备属于第b状态的真实标记，为真实标记，若第s台智能制造装备的状态类别属于b则为1，否则为0，B为状态总数，N为智能制造装备总台数。

附图说明

[0071] 图1门控三塔Transformer架构图；

[0072] 图2通道特征与时序特征示意图；

[0073] 图3每日文本表示提取结构图；

[0074] 图4滑窗掩膜注意力层与多尺度聚合模块结构图；

[0075] 图5跨塔注意力模块结构图。