[0067] 以下通过具体实施例进一步说明本发明的技术方案,但是本发明的技术方案不以实施例为限。
[0068] 一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法,包括如下步骤:
[0069] (1)建立神经网络模型
[0070] 神经网络与机器人工作空间具有相同的拓扑结构,每个神经元对应于机器人工作空间的一个离散状态。所有神经元都只与其局部邻域内的神经元相连接,其中第i个神经元与其邻域内神经元的连接形式如图1所示。并且其连接形式都相同,整个神经网络由N×N个神经元组成二维拓扑结构。神经网络具有高度并行的体系结构,所有连接权都相等,神经元之间信息的传播是双向的。神经网络在演化过程中根据每一个离散状态的输入更新其邻域内的状态,整个神经网络可以看作一个离散时间动力学系统。
[0071] 神经网络在演化过程中,根据信息素的释放和挥发信息在神经网络拓扑结构中的映射产生神经网络的外部输入。当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa,其他机器人将逐渐地被吸引到其所在的信息素轨迹上;当机器人避障时将释放排斥信息素Po,当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe。S型激活函数保证了信息素逐渐衰减地在工作空间内传播,所有神经元输出值就构成了一个曲面,曲面上每一个点的值就代表其所对应状态的信息素浓度。
[0072] 整个神经网络由N×N个神经元组成二维拓扑结构,第i个神经元对应于结构空间的第i 个离散状态,每个神经元都只与其相邻的神经元连接,连接形式都相同,具有高度并行的体系结构,所有连接权都相等,神经元之间的信息双向传播,根据所述第i个神经元离散时间动力学方程为:
[0073] 神经网络的第i个神经元对应于结构空间的第i个离散状态,则第i个神经元离散时间动力学方程为:
[0074]
[0075] 公式中,xi(t+1)和xi(t)分别为第i个神经元在t+1和t时刻的输出值,N为第i个神经元邻域内的神经元个数,Ii(t)为第i个神经元在t时刻的外部输入,神经网络根据Ii(t)的变化随时更新输出,wij为第j个神经元到第i个神经元的连接权,f为激活函数,所述激活函数f 选择S型函数,定义如下:
[0076]
[0077] 神经网络在演化过程中,根据信息素在拓扑结构中的映射产生外部输入,第i个神经元的外部输入由探索区域及信息素释放的位置信息在神经网络拓扑结构中的映射产生的,当机器人运动到第i个神经元所对应的位置时,如果机器人处于搬运状态则将Ii(t)赋值为Pa,如果机器人处于搜索状态则将Ii(t)赋值为Pe,如果机器人处于避障状态则将Ii(t)赋值为Po,定义如下:
[0078]
[0079] 公式中,吸引信息素Pa为较大的正值,排斥信息素Po和排斥信息素Pe为较小的负值;当觅食机器人发现食物并将其运回巢穴时释放吸引信息素Pa;当机器人避障时将释放排斥信息素Po,当机器人在工作环境中随机搜寻食物时将释放排斥信息素Pe;
[0080] 所述连接权计算公式如下式:
[0081]
[0082] 公式中,|i-j|为结构空间中向量xi和xj之间的Euclidian距离;
[0083] (2)设计信息素挥发模型
[0084] 信息素演化包括两个动态过程,即机器人在某个位置释放了信息素以后通过介质向周围传播,同时信息素不断地挥发以减小其浓度,驱动觅食机器人探索新的区域,信息素挥发模型定义如下:
[0085]
[0086] 公式中,ρ为挥发率,Δxj(t)为第i个神经元邻域内信息素浓度变化量,第i个神经元邻域内的神经元个数为8,因此N=8;
[0087] (3)建立系统总体行为框架模型
[0088] 系统总体行为框架模型包括多种不同的典型行为:搜索、避障、等待、搬运等,协作觅食有限状态机模型如图3所示,每一个状态代表处于不同任务的机器人数量,机器人在觅食过程中不同状态的机器人相互转换,当某个机器人找到最短路径时,通过释放信息素更新神经网络与周围机器人通信,吸引更多的机器人加入最短路径中,同时释放更多的信息素,经过不断的优化,最终实现所有机器人都走最短路径。
[0089] 系统中机器人典型行为描述如下:
[0090] 搜索:机器人以固定的速度在整个工作区域进行随机探索,搜索过程中释放排斥信息素 Pe;
[0091] 避障:机器人如果遇到障碍物则避开并释放排斥信息素Po;
[0092] 等待:机器人如果发现食物源则停止搜索,并在食物源附近等待其他机器人进行协作,同时释放吸引信息素Pa;其他机器人发现等待状态的机器人则形成协作团队将食物搬运回巢穴;
[0093] 搬运:协作团队机器人沿吸引信息素Pa路径将食物搬回巢穴,同时释放更多的吸引信息素Pa;
[0094] 本发明所研究的群机器人系统为同构系统,系统由一组完全相同的反应式机器人组成,机器人之间进行简单局部交互,不具有显式通信。在群机器人协作觅食过程中机器人通过采用不同的策略进行觅食。在初始阶段所有机器人没有关于环境的先验知识,并从巢穴区域出发随机搜索食物源,在觅食任务中需要两个机器人协作对事物进行搬运。一旦发现食物搜索机器人将在接下来的时间τ等待其他机器人的协作,如果在等待时间内没有其他机器人发现处于等待状态的机器人,等待机器人将放弃当前任务重新搜索其他食物源;如果在等待时间内有搜索机器人发现了等待状态的机器人,则两个觅食机器人将形成团队并将食物搬运回巢穴;将食物搬回巢穴以后搬运机器人重新进行搜索,协作觅食行为如图2所示。
[0095] 本发明的群机器人在神经网络的不断演化中也会不断优化行为和路径,找到最短路径的机器人释放的排斥信息素Pe最少,同时吸引信息素Pa挥发得也最少,吸引更多机器人前来,随着越来越多的机器人加入,信息素路径不断得到强化,觅食路径也不断得到优化,最终所有觅食机器人都会沿着最短的信息素路径进行觅食行为。
[0096] 进一步,所述群机器人基于信息素的觅食行为算法如下:
[0097] ①神经网络输出初始化为零
[0098] ②xi(t=0)=0
[0099] ③机器人开始觅食直到食物耗尽
[0100] ④机器人搜寻食物直到发现食物源
[0101] ⑤随机行走或者沿信息素路径运动
[0102] ⑥同时释放排斥信息素PoorPe并更新神经网络输出:
[0103] ⑦ Ii(t)=PoorPe
[0104] ⑧返回步骤④
[0105] ⑨机器人将食物运回巢穴
[0106] ⑩沿信息素路径运动
[0107] ⑪同时释放吸引信息素Pa并更新神经网络输出:
[0108] ⑫ Ii(t)=Pa
[0109] ⑬返回步骤⑨
[0110] ⑭信息素挥发:
[0111] ⑮
[0112] ⑯返回步骤③
[0113] 实施例:群机器人协作觅食仿真实验
[0114] 为了说明基于神经网络的群机器人信息素通信实现方法,在实验室所建立的移动机器人环境建模与探索软件平台上,进行了仿真实验。觅食机器人巢穴位于工作空间的左下角,机器人从巢穴出发开始搜寻食物源,食物源位于工作环境的右上角,如图4(a)所示,灰色矩形为可移动的障碍物。搜索机器人(圆圈)根据方程(1)“第i个神经元离散时间动力学方程”释放的排斥信息素Po和Pe逐渐衰减地传播到整个工作空间,如图4(b)所示,排斥信息素Po和Pe的区域为机器人已经搜寻过的区域,排斥信息素将驱动其它觅食同伴搜寻新的区域,从而提高觅食机器人发现食物源的效率。
[0115] 当搜索机器人发现食物源并协作成功,机器人将食物搬运回巢穴,搬运机器人(黑色圆点)在从食物源到巢穴的路径释放吸引信息素Pa,如图4(c)所示,吸引信息素Pa同样逐渐衰减地传播到整个工作空间。当搬运机器人将食物搬运回巢穴以后将招募其他机器人一起进行觅食,吸引信息素Pa不断吸引其他觅食机器人到达食物源并将食物沿觅食路径搬运回巢穴,觅食轨迹上的吸引信息素Pa浓度逐渐增强。最终所有机器人沿吸引信息素Pa轨迹进行觅食行为,从而涌现出了自组织的群智能行为,如图4(d)所示。
[0116] 为了验证所提出的信息素模型的有效性和可靠性,在工作空间右下角设置另外一个食物源,如图5(a)所示。觅食任务开始以后搜寻机器人发现了两个食物源,并将食物不断从两个食物源搬运到巢穴,如图5(b)与图5(c)所示。搬运机器人在觅食轨迹上释放吸引信息素Pa形成从两个食物源到巢穴的两条信息素轨迹,系统运行一段时间以后灰色矩形障碍物向上移动10个栅格,信息素分布将不断更新,觅食路径也将不断优化,如图5(d)所示。越来越多的机器人选择较短的路径进行觅食,较短路径上的吸引信息素Pa浓度不断增大,最终所有机器人放弃较长的觅食路径,沿最短路径搜寻、搬运食物。觅食路径以外区域信息素逐渐挥发,浓度不断减小,最终完全消失。本发明利用神经网络建立了群机器人信息素通信模型,在系统演化过程中通过机器人之间的局部交互涌现出了自组织的群体行为。
[0117] 协作觅食系统的最优决策策略决定于协作过程的最优等待时间,等待时间直接影响了协作觅食的效率。系统另外一个重要约束就是机器人个体的能力,也就是需要多少个机器人的协作才能够将食物搬运回巢穴,在本发明中需要两个机器人进行协作才能够将食物运回巢穴。机器人在觅食过程中能够获得食物,同时也需要能量和时间搜寻、搬运食物,系统的整体目标就是以最小的代价获得最多的食物。为了确定最优决策策略,基于最优觅食理论将机器人觅食效率定义为搬运食物的数量与时间的比值:
[0118]
[0119] 公式中,E是机器人觅食效率,nf(t)是在t时刻搬运的食物数量。图6是最佳等待时间τo=2s时觅食效率示意图,开始阶段所有机器人都进行搜索,没有食物被运回巢穴,食物曲线具有较小斜率,随着时间的进行,斜率逐渐增大,最佳拟合曲线的斜率就是觅食行为的平均效率,最佳平均觅食效率为0.32。图7是等待时间τ=5s时觅食效率示意图,平均觅食效率为0.23。
[0120] 以上对本发明所提供的一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法进行了详细介绍。本文通过具体实施方式对本发明的原理和实施方式进行了阐述,以上说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。