首页 > 专利 > 山东大学 > 一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法专利详情

一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2018-10-22

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2019-02-26

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2019-11-29

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2038-10-22

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201811229448.5	申请日	2018-10-22
公开/公告号	CN109270905B	公开/公告日	2019-11-29
授权日	2019-11-29	预估到期日	2038-10-22
申请年	2018年	公开/公告年	2019年
缴费截止日
分类号	G05B19/418	主分类号	G05B19/418
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	1
权利要求数量	2	非专利引证数量	0
引用专利数量	6	被引证专利数量	0
非专利引证
引用专利	US2009221316A1、CN106779177A、CN106295793A、CN106654987A、CN103473598A、WO03066639A2	被引证专利
专利权维持	4	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	山东大学	第一申请人	山东大学
专利权人	山东大学	当前专利权人	山东大学
发明人	宋勇、李贻斌、方兴、李彩虹、刘海	第一发明人	宋勇
地址	山东省济南市山大南路27号	邮编	250100
申请人数量	1	发明人数量	5
申请人所在省	山东省	申请人所在市	山东省济南市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

深圳龙图腾专利代理有限公司

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

蔡瑞

摘要

本发明涉及一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法，包括如下步骤：建立神经网络模型、设计信息素挥发模型、建立系统总体行为框架模型。本发明特别提出了群机器人协作觅食行为的信息素挥发模型，定义为Ii(t)，即第i个神经元在t时刻的外部输入，公式中，吸引信息素Pa为较大的正值，排斥信息素Po和排斥信息素Pe为较小的负值；当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa；当机器人避障时将释放排斥信息素Po，当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe，神经网络根据Ii(t)的变化随时更新输出，神经网络的演化使群机器人能够进行局部通信，在交互过程中涌现出自组织的群体行为。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4(a)
说明书附图：图4(b)
说明书附图：图4(c)
说明书附图：图4(d)
说明书附图：图5(a)
说明书附图：图5(b)
说明书附图：图5(c)
说明书附图：图5(d)
说明书附图：图6
说明书附图：图7

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2019-11-29	授权
2	2019-02-26	实质审查的生效	IPC(主分类): G05B 19/418 专利申请号: 201811229448.5 申请日: 2018.10.22
3	2019-01-25	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法，其特征在于，包括如下步骤：
(1)建立神经网络模型
整个神经网络由N×N个神经元组成二维拓扑结构，第i个神经元对应于结构空间的第i个离散状态，每个神经元都只与其相邻的神经元连接，连接形式都相同，具有高度并行的体系结构，所有连接权都相等，神经元之间的信息双向传播，根据所述第i个神经元离散时间动力学方程为：
公式中，xi(t+1)和xi(t)分别为第i个神经元在t+1和t时刻的输出值，N为第i个神经元邻域内的神经元个数，Ii(t)为第i个神经元在t时刻的外部输入，神经网络根据Ii(t)的变化随时更新输出，wij为第j个神经元到第i个神经元的连接权，f为激活函数，所述激活函数f选择S型函数，定义如下：
神经网络在演化过程中，根据信息素在拓扑结构中的映射产生外部输入，第i个神经元的外部输入由探索区域及信息素释放的位置信息在神经网络拓扑结构中的映射产生的，当机器人运动到第i个神经元所对应的位置时，如果机器人处于搬运状态则将Ii(t)赋值为Pa，如果机器人处于搜索状态则将Ii(t)赋值为Pe，如果机器人处于避障状态则将Ii(t)赋值为Po，定义如下：
公式中，吸引信息素Pa为较大的正值，排斥信息素Po和排斥信息素Pe为较小的负值；当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa；当机器人避障时将释放排斥信息素Po，当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe；
所述连接权计算公式如下式：
公式中，|i-j|为结构空间中向量xi和xj之间的Euclidian距离；
(2)设计信息素挥发模型
信息素演化包括两个动态过程，即机器人在某个位置释放了信息素以后通过介质向周围传播，同时信息素不断地挥发以减小其浓度，驱动觅食机器人探索新的区域，信息素挥发模型定义如下：
公式中，ρ为挥发率,N为第i个神经元邻域内的神经元个数，Δxj(t)为第i个神经元邻域内信息素浓度变化量；
(3)建立系统总体行为框架模型
系统中机器人典型行为描述如下：
搜索：机器人以固定的速度在整个工作区域进行随机探索，搜索过程中释放排斥信息素Pe；
避障：机器人如果遇到障碍物则避开并释放排斥信息素Po；
等待：机器人如果发现食物源则停止搜索，并在食物源附近等待其他机器人进行协作，同时释放吸引信息素Pa；其他机器人发现等待状态的机器人则形成协作团队将食物搬运回巢穴；
搬运：协作团队机器人沿吸引信息素Pa路径将食物搬回巢穴，同时释放更多的吸引信息素Pa；
(4)群机器人协作觅食行为算法如下：
①神经网络输出初始化为零
②xi(t＝0)＝0
③机器人开始觅食直到食物耗尽
④机器人搜寻食物直到发现食物源
⑤随机行走或者沿信息素路径运动
⑥同时释放排斥信息素Po or Pe并更新神经网络输出：
⑦
⑧返回步骤④
⑨机器人将食物运回巢穴
⑩沿信息素路径运动
⑪ 同时释放吸引信息素Pa并更新神经网络输出：
⑫
⑬ 返回步骤⑨
⑭ 信息素挥发:
⑮
⑯ 返回步骤③。

2.根据权利要求1所述基于神经网络的群机器人利用信息素通信实现协作觅食的方法，其特征在于，所述神经网络与机器人的工作空间具有相同的拓扑结构。

说明书

技术领域

[0001] 本发明涉及群智能机器人自组织行为涌现方法，利用神经网络建立信息素模型，机器人通过局部交互涌现出群体智能行为，属于群智能机器人技术领域，具体涉及一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法。

背景技术

[0002] 多机器人系统的研究始于20世纪70年代后期，研究人员将人工智能中的多智能体理论应用到多机器人系统中，开始了机器人领域的多机器人技术的研究。初期的研究主要集中在系统体系结构、多机器人运动规划及系统可重构等几个方面，随着分布式人工智能、复杂系统、社会学、生物学等研究领域的理论与方法的引入，多机器人系统的研究开始探讨系统组织形式、信息交互方式、进化学习机制等关键的理论技术问题。目前，受生物学和社会学的启发，多机器人系统关键问题的研究取得了相当的进展，研究人员将一些社会现象工程化，并且运用到机器人群体行为的设计上，将多机器人系统作为一个社会群体，为其制定一系列的社会规范，机器人系统就成为了一个较为复杂的机器人社会。多机器人群体行为学习主要研究机器人之间及机器人与周围环境进行社会性交互的机制，在社会性交互作用过程中涌现出复杂的群体行为与群体智能。

[0003] 群智能智能机器人是一个新兴的学科，属于多机器人系统的范畴，主要研究机器人之间及机器人与环境如何通过有限感知和局部交互涌现出期望的群体行为。随着多机器人系统研究的不断深入，一些社会性生物自组织模型为机器人群体行为的研究提供了有益的启发，研究人员开始采用Stigmergy(个体通过改变共同环境实现间接通信)机制对机器人群体行为进行建模与分析。Stigmergy机制最早是由Grasse提出来的，用来解释白蚁的筑巢行为， Deneubourg等利用“蚂蚁机器人”对Stigmergy机制进行了开创性的仿真和物理实验。

[0004] 群智能机器人系统是模仿社会性昆虫或其它社会性生物群体行为所建立的系统，由许多无差别自治机器人在完全分布式控制下组成的机器人群体。群机器人学已经在工程实践中产生了大量的应用范例，包括自主驾驶、搬运机器人、自主农业机器人以及自主仓储机器人等。群智能机器人主要研究如何使能力有限的机器人个体通过局部交互涌现出群体智能，典型的群智能机器人系统包括：The Nerd Herd系统、Collective Robotics系统以及Swarm系统等。The Nerd Herd系统是由美国南加利福尼亚大学的Maja Mataric教授负责开发的，由多个相同的机器人组成，每个机器人都采用包容结构进行行为设计，Mataric探讨了群体密度和行为规则对系统性能的影响，实现了机器人编队穿越门体的群体行为。该系统可用于机器人大规模群体行为的仿真与实验研究。Collective Robotics系统是由加拿大Alberta大学开发的，将许多简单机器人组成一个团体完成复杂的任务。Swarm系统是由美国学者Jin和Beni 等研究开发的，是由大量简单自治机器人组成的分布式系统。

[0005] 协作机器人系统是由许多具有一定智能的自治机器人组成的，机器人通过简单个体行为的交互作用完成复杂的任务，典型的协作机器人系统包括：ACTRESS系统、CEBOT系统以及CESAR Emperor和CESAR Nomads机器人系统。ACTRESS系统是由Asama等人提出来的，是一个用于多种不同类型任务的多机器人系统，系统通过底层通信结构将机器人与外围设备连接起来。通常情况下，机器人个体独立工作，但是如果系统需要协作时，机器人能够组成合作群体来执行具体的任务。CEBOT系统是由Fukuda教授提出的一种在分散式自治机器人系统中隐现群体协作行为的机制，将系统中大量具有独立功能的机器人视为细胞元，根据任务或环境的变化，细胞元机器人可以移动、寻找与组合，自组织形成功能复杂的机器人系统。自重构机器人系统中，机器人之间的交互作用展现了协作的移动性，机器人根据任务需要在身体上互相合作或以类似的方式相互作用。美国Oak Ridge国家实验室的Parker博士及其研究小组建立了CESAR Emperor和CESAR Nomads实验平台，在协作机器人学方面进行了大量的理论研究与实验验证，并利用ALLIANCE结构演示了多机器人目标观察。

[0006] 目前，生物启发系统模型的实现算法主要包括粒子群优化和蚁群算法。粒子群优化是一种基于社会影响和社会学习的群体行为计算建模和实现方法，是对生物群体的软仿生。 Pugh等利用粒子群优化方法提出了一种机器人群体行为分布式在线学习算法，并且探讨了群体规模对机器人群体行为学习速度的影响。Moutarde利用粒子群优化方法设计机器人递归神经网络控制器，学习获得群体机器人协作觅食行为。蚁群算法受蚁群觅食过程中所呈现的涌现现象的启发，个体通过简单的局部交互作用涌现出复杂的群体行为。Chiou等基于模糊蚁群优化提出了一种足球机器人群体行为学习算法，根据蚁群算法设计避碰规则，并利用预测控制预测下一时刻目标位置。Chen等利用蚁群优化算法和仿射变换实现了多机器人队形变换，通过仿射变换预先确定每个机器人的目标位置，利用蚁群优化算法获得机器人群体无碰撞最短路径。

[0007] 虽然研究人员已经在群智能机器人学方面都取得了大量卓有成效的研究成果，但是由于多机器人行为学习的一些问题在理论上还没有得到很好地解决，作为一个研究领域群智能机器人学的理论框架和实现方法均需要进一步完善。。

发明内容

[0008] 为解决上述问题，本发明提出一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法，目的在于提供一种基于信息素的局部通信模式，设计机器人最优决策策略，加快群体智能行为的涌现过程，实现群机器人协作完成任务的方法。

[0009] 本发明的基于神经网络的群机器人利用信息素通信实现协作觅食的方法，包括如下步骤： (1)建立神经网络模型

[0010] 整个神经网络由N×N个神经元组成二维拓扑结构，第i个神经元对应于结构空间的第i 个离散状态，每个神经元都只与其相邻的神经元连接，连接形式都相同，具有高度并行的体系结构，所有连接权都相等，神经元之间的信息双向传播，根据所述第i个神经元离散时间动力学方程为：

[0011]

[0012] 公式中，xi(t+1)和xi(t)分别为第i个神经元在t+1和t时刻的输出值，N为第i个神经元邻域内的神经元个数，li(t)为第i个神经元在t时刻的外部输入，神经网络根据li(t)的变化随时更新输出，wij为第j个神经元到第i个神经元的连接权，f为激活函数，所述激活函数f 选择S型函数，定义如下：

[0013]

[0014] 神经网络在演化过程中，根据信息素在拓扑结构中的映射产生外部输入，第i个神经元的外部输入由探索区域及信息素释放的位置信息在神经网络拓扑结构中的映射产生的，当机器人运动到第i个神经元所对应的位置时，如果机器人处于搬运状态则将Ii(t)赋值为Pa，如果机器人处于搜索状态则将Ii(t)赋值为Pe，如果机器人处于避障状态则将Ii(t)赋值为Po，定义如下：

[0015]

[0016] 公式中，吸引信息素Pa为较大的正值，排斥信息素Po和排斥信息素Pe为较小的负值；当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa；当机器人避障时将释放排斥信息素Po，当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe；

[0017] 所述连接权计算公式如下式：

[0018]

[0019] 公式中，|i-j|为结构空间中向量xi和xj之间的Eucliclian距离；

[0020] (2)设计信息素挥发模型

[0021] 信息素演化包括两个动态过程，即机器人在某个位置释放了信息素以后通过介质向周围传播，同时信息素不断地挥发以减小其浓度，驱动觅食机器人探索新的区域，信息素挥发模型定义如下：

[0022]

[0023] 公式中，ρ为挥发率，N为第i个神经元邻域内的神经元个数，Δxj(t)为第i个神经元邻域内信息素浓度变化量；

[0024] (3)建立系统总体行为框架模型

[0025] 系统中机器人典型行为描述如下：

[0026] 搜索：机器人以固定的速度在整个工作区域进行随机探索，搜索过程中释放排斥信息素Pe；

[0027] 避障：机器人如果遇到障碍物则避开并释放排斥信息素Po；

[0028] 等待：机器人如果发现食物源则停止搜索，并在食物源附近等待其他机器人进行协作，同时释放吸引信息素Pa；其他机器人发现等待状态的机器人则形成协作团队将食物搬运回巢穴；

[0029] 搬运：协作团队机器人沿吸引信息素Pa路径将食物搬回巢穴，同时释放更多的吸引信息素Pa；

[0030] 所述群机器人协作觅食行为算法如下：

[0031] ①神经网络输出初始化为零

[0032] ②xi(t＝0)＝0

[0033] ③机器人开始觅食直到食物耗尽

[0034] ④机器人搜寻食物直到发现食物源

[0035] ⑤随机行走或者沿信息素路径运动

[0036] ⑥同时释放排斥信息素PoorPe并更新神经网络输出：

[0037] ⑦ Ii(t)＝PoorPe

[0038] ⑧返回步骤④

[0039] ⑨机器人将食物运回巢穴

[0040] ⑩沿信息素路径运动

[0041] ⑪同时释放吸引信息素Pa并更新神经网络输出：

[0042] ⑫ Ii(t)＝Pa

[0043] ⑬返回步骤⑨

[0044] ⑭信息素挥发：

[0045] ⑮

[0046] ⑯返回步骤③

[0047] 进一步，所述神经网络与机器人的工作空间具有相同的拓扑结构。

[0048] 本发明的有益效果如下：

[0049] 1.建立了群机器人信息素传播的神经网络模型，实现信息素在整个空间网络里衰减地传播：采用本发明的神经网络模型，当机器人在环境中某个位置释放了信息素以后，该状态对应神经元就具有相应的外部输入，根据外部输入更新其输出，神经元利用局部连接更新其邻域内的状态，从而使得信息素能够在整个工作空间逐渐衰减地进行传播。

[0050] 2.设计了信息素挥发模型，推进神经网络演化，促进群机器人局部通信，加速涌现自组织的群体行为：本发明特别提出了群机器人协作觅食行为的信息素挥发模型，定义为li(t)，即第i个神经元在t时刻的外部输入，神经网络根据li(t)的变化随时更新输出，神经网络的演化很好地模拟了信息素的释放挥发过程，使群机器人能够进行局部通信，在交互过程中涌现出自组织的群体行为。

[0051] 3.具有自动优化路径和行为的功能：本发明能够使群机器人基于信息素的局部通信模式有，有效选择最优路径和行为，并吸引其他机器人参与，加快群体智能行为的涌现过程，最终实现所有机器人都会沿着最短的信息素路径进行的协作觅食行为。

实施方案

[0067] 以下通过具体实施例进一步说明本发明的技术方案，但是本发明的技术方案不以实施例为限。

[0068] 一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法，包括如下步骤：

[0069] (1)建立神经网络模型

[0070] 神经网络与机器人工作空间具有相同的拓扑结构，每个神经元对应于机器人工作空间的一个离散状态。所有神经元都只与其局部邻域内的神经元相连接，其中第i个神经元与其邻域内神经元的连接形式如图1所示。并且其连接形式都相同，整个神经网络由N×N个神经元组成二维拓扑结构。神经网络具有高度并行的体系结构，所有连接权都相等，神经元之间信息的传播是双向的。神经网络在演化过程中根据每一个离散状态的输入更新其邻域内的状态，整个神经网络可以看作一个离散时间动力学系统。

[0071] 神经网络在演化过程中，根据信息素的释放和挥发信息在神经网络拓扑结构中的映射产生神经网络的外部输入。当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa，其他机器人将逐渐地被吸引到其所在的信息素轨迹上；当机器人避障时将释放排斥信息素Po，当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe。S型激活函数保证了信息素逐渐衰减地在工作空间内传播，所有神经元输出值就构成了一个曲面，曲面上每一个点的值就代表其所对应状态的信息素浓度。

[0072] 整个神经网络由N×N个神经元组成二维拓扑结构，第i个神经元对应于结构空间的第i 个离散状态，每个神经元都只与其相邻的神经元连接，连接形式都相同，具有高度并行的体系结构，所有连接权都相等，神经元之间的信息双向传播，根据所述第i个神经元离散时间动力学方程为：

[0073] 神经网络的第i个神经元对应于结构空间的第i个离散状态，则第i个神经元离散时间动力学方程为：

[0074]

[0075] 公式中，xi(t+1)和xi(t)分别为第i个神经元在t+1和t时刻的输出值，N为第i个神经元邻域内的神经元个数，Ii(t)为第i个神经元在t时刻的外部输入，神经网络根据Ii(t)的变化随时更新输出，wij为第j个神经元到第i个神经元的连接权，f为激活函数，所述激活函数f 选择S型函数，定义如下：

[0076]

[0077] 神经网络在演化过程中，根据信息素在拓扑结构中的映射产生外部输入，第i个神经元的外部输入由探索区域及信息素释放的位置信息在神经网络拓扑结构中的映射产生的，当机器人运动到第i个神经元所对应的位置时，如果机器人处于搬运状态则将Ii(t)赋值为Pa，如果机器人处于搜索状态则将Ii(t)赋值为Pe，如果机器人处于避障状态则将Ii(t)赋值为Po，定义如下：

[0078]

[0079] 公式中，吸引信息素Pa为较大的正值，排斥信息素Po和排斥信息素Pe为较小的负值；当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa；当机器人避障时将释放排斥信息素Po，当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe；

[0080] 所述连接权计算公式如下式：

[0081]

[0082] 公式中，|i-j|为结构空间中向量xi和xj之间的Euclidian距离；

[0083] (2)设计信息素挥发模型

[0084] 信息素演化包括两个动态过程，即机器人在某个位置释放了信息素以后通过介质向周围传播，同时信息素不断地挥发以减小其浓度，驱动觅食机器人探索新的区域，信息素挥发模型定义如下：

[0085]

[0086] 公式中，ρ为挥发率，Δxj(t)为第i个神经元邻域内信息素浓度变化量，第i个神经元邻域内的神经元个数为8，因此N＝8；

[0087] (3)建立系统总体行为框架模型

[0088] 系统总体行为框架模型包括多种不同的典型行为：搜索、避障、等待、搬运等，协作觅食有限状态机模型如图3所示，每一个状态代表处于不同任务的机器人数量，机器人在觅食过程中不同状态的机器人相互转换，当某个机器人找到最短路径时，通过释放信息素更新神经网络与周围机器人通信，吸引更多的机器人加入最短路径中，同时释放更多的信息素，经过不断的优化，最终实现所有机器人都走最短路径。

[0089] 系统中机器人典型行为描述如下：

[0090] 搜索：机器人以固定的速度在整个工作区域进行随机探索，搜索过程中释放排斥信息素 Pe；

[0091] 避障：机器人如果遇到障碍物则避开并释放排斥信息素Po；

[0092] 等待：机器人如果发现食物源则停止搜索，并在食物源附近等待其他机器人进行协作，同时释放吸引信息素Pa；其他机器人发现等待状态的机器人则形成协作团队将食物搬运回巢穴；

[0093] 搬运：协作团队机器人沿吸引信息素Pa路径将食物搬回巢穴，同时释放更多的吸引信息素Pa；

[0094] 本发明所研究的群机器人系统为同构系统，系统由一组完全相同的反应式机器人组成，机器人之间进行简单局部交互，不具有显式通信。在群机器人协作觅食过程中机器人通过采用不同的策略进行觅食。在初始阶段所有机器人没有关于环境的先验知识，并从巢穴区域出发随机搜索食物源，在觅食任务中需要两个机器人协作对事物进行搬运。一旦发现食物搜索机器人将在接下来的时间τ等待其他机器人的协作，如果在等待时间内没有其他机器人发现处于等待状态的机器人，等待机器人将放弃当前任务重新搜索其他食物源；如果在等待时间内有搜索机器人发现了等待状态的机器人，则两个觅食机器人将形成团队并将食物搬运回巢穴；将食物搬回巢穴以后搬运机器人重新进行搜索，协作觅食行为如图2所示。

[0095] 本发明的群机器人在神经网络的不断演化中也会不断优化行为和路径，找到最短路径的机器人释放的排斥信息素Pe最少，同时吸引信息素Pa挥发得也最少，吸引更多机器人前来，随着越来越多的机器人加入，信息素路径不断得到强化，觅食路径也不断得到优化，最终所有觅食机器人都会沿着最短的信息素路径进行觅食行为。

[0096] 进一步，所述群机器人基于信息素的觅食行为算法如下：

[0097] ①神经网络输出初始化为零

[0098] ②xi(t＝0)＝0

[0099] ③机器人开始觅食直到食物耗尽

[0100] ④机器人搜寻食物直到发现食物源

[0101] ⑤随机行走或者沿信息素路径运动

[0102] ⑥同时释放排斥信息素PoorPe并更新神经网络输出：

[0103] ⑦ Ii(t)＝PoorPe

[0104] ⑧返回步骤④

[0105] ⑨机器人将食物运回巢穴

[0106] ⑩沿信息素路径运动

[0107] ⑪同时释放吸引信息素Pa并更新神经网络输出：

[0108] ⑫ Ii(t)＝Pa

[0109] ⑬返回步骤⑨

[0110] ⑭信息素挥发：

[0111] ⑮

[0112] ⑯返回步骤③

[0113] 实施例：群机器人协作觅食仿真实验

[0114] 为了说明基于神经网络的群机器人信息素通信实现方法，在实验室所建立的移动机器人环境建模与探索软件平台上，进行了仿真实验。觅食机器人巢穴位于工作空间的左下角，机器人从巢穴出发开始搜寻食物源，食物源位于工作环境的右上角，如图4(a)所示，灰色矩形为可移动的障碍物。搜索机器人(圆圈)根据方程(1)“第i个神经元离散时间动力学方程”释放的排斥信息素Po和Pe逐渐衰减地传播到整个工作空间，如图4(b)所示，排斥信息素Po和Pe的区域为机器人已经搜寻过的区域，排斥信息素将驱动其它觅食同伴搜寻新的区域，从而提高觅食机器人发现食物源的效率。

[0115] 当搜索机器人发现食物源并协作成功，机器人将食物搬运回巢穴，搬运机器人(黑色圆点)在从食物源到巢穴的路径释放吸引信息素Pa，如图4(c)所示，吸引信息素Pa同样逐渐衰减地传播到整个工作空间。当搬运机器人将食物搬运回巢穴以后将招募其他机器人一起进行觅食，吸引信息素Pa不断吸引其他觅食机器人到达食物源并将食物沿觅食路径搬运回巢穴，觅食轨迹上的吸引信息素Pa浓度逐渐增强。最终所有机器人沿吸引信息素Pa轨迹进行觅食行为，从而涌现出了自组织的群智能行为，如图4(d)所示。

[0116] 为了验证所提出的信息素模型的有效性和可靠性，在工作空间右下角设置另外一个食物源，如图5(a)所示。觅食任务开始以后搜寻机器人发现了两个食物源，并将食物不断从两个食物源搬运到巢穴，如图5(b)与图5(c)所示。搬运机器人在觅食轨迹上释放吸引信息素Pa形成从两个食物源到巢穴的两条信息素轨迹，系统运行一段时间以后灰色矩形障碍物向上移动10个栅格，信息素分布将不断更新，觅食路径也将不断优化，如图5(d)所示。越来越多的机器人选择较短的路径进行觅食，较短路径上的吸引信息素Pa浓度不断增大，最终所有机器人放弃较长的觅食路径，沿最短路径搜寻、搬运食物。觅食路径以外区域信息素逐渐挥发，浓度不断减小，最终完全消失。本发明利用神经网络建立了群机器人信息素通信模型，在系统演化过程中通过机器人之间的局部交互涌现出了自组织的群体行为。

[0117] 协作觅食系统的最优决策策略决定于协作过程的最优等待时间，等待时间直接影响了协作觅食的效率。系统另外一个重要约束就是机器人个体的能力，也就是需要多少个机器人的协作才能够将食物搬运回巢穴，在本发明中需要两个机器人进行协作才能够将食物运回巢穴。机器人在觅食过程中能够获得食物，同时也需要能量和时间搜寻、搬运食物，系统的整体目标就是以最小的代价获得最多的食物。为了确定最优决策策略，基于最优觅食理论将机器人觅食效率定义为搬运食物的数量与时间的比值：

[0118]

[0119] 公式中，E是机器人觅食效率，nf(t)是在t时刻搬运的食物数量。图6是最佳等待时间τo＝2s时觅食效率示意图，开始阶段所有机器人都进行搜索，没有食物被运回巢穴，食物曲线具有较小斜率，随着时间的进行，斜率逐渐增大，最佳拟合曲线的斜率就是觅食行为的平均效率，最佳平均觅食效率为0.32。图7是等待时间τ＝5s时觅食效率示意图，平均觅食效率为0.23。

[0120] 以上对本发明所提供的一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法进行了详细介绍。本文通过具体实施方式对本发明的原理和实施方式进行了阐述，以上说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

附图说明

[0052] 图1是第i个神经元邻域结构示意图。

[0053] 图2是协作觅食行为流程图。

[0054] 图3是协作觅食行为有限状态机模型。

[0055] 图4是单食物源机器人觅食过程信息素分布示意图。

[0056] 图4(a)信息素在t＝0时刻分布图

[0057] 图4(b)信息素在t＝20时刻分布图

[0058] 图4(c)信息素在t＝80时刻分布图

[0059] 图4(d)信息素在t＝200时刻分布图

[0060] 图5是双食物源机器人觅食过程信息素分布示意图。

[0061] 图5(a)信息素在t＝0时刻分布图

[0062] 图5(b)信息素在t＝20时刻分布图

[0063] 图5(c)信息素在t＝60时刻分布图

[0064] 图5(d)信息素在t＝200时刻分布图

[0065] 图6是最佳等待时间τo＝2s时觅食效率示意图。

[0066] 图7是等待时间τ＝5s时觅食效率示意图。

1一种具有烘干和杀菌功能的鞋底清洗设备及其电学系统 2一种重型卡车轮毂壳尺寸检测机 3一种工业电器旋钮 4一种根据汞发散量调节温度的彩瓷烧结装置 5智能化油水分离罐除油系统及控制方法 6一种炒货食品翻炒除尘装置 7一种水肥混合装置的控制方法 8一种具有三维空间移动功能的刨床的智能控制系统 9一种污水处理中悬浮物含量的控制检测方法、装置及计算机设备 10一种基于资源互补的移动式换装设备