首页 > 专利 > 燕山大学 > 基于信息可见的MEC系统任务调度策略的博弈优化方法专利详情

基于信息可见的MEC系统任务调度策略的博弈优化方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-06-15

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-09-24

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-03-15

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-06-15

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202110661466.6	申请日	2021-06-15
公开/公告号	CN113360248B	公开/公告日	2022-03-15
授权日	2022-03-15	预估到期日	2041-06-15
申请年	2021年	公开/公告年	2022年
缴费截止日
分类号	G06F9/455 、H04L67/10	主分类号	G06F9/455
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	5
权利要求数量	6	非专利引证数量	1
引用专利数量	0	被引证专利数量	0
非专利引证	1、CN 110099384 A,2019.08.06CN 112101728 A,2020.12.18金顺福等.基于备用虚拟机同步休眠的云数据中心节能策略及性能《.吉林大学学报(工学版)》.2018,第48卷(第6期),;
引用专利		被引证专利
专利权维持	1	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	燕山大学	第一申请人	燕山大学
专利权人	燕山大学	当前专利权人	燕山大学
发明人	金顺福、陈梦盼、李小良	第一发明人	金顺福
地址	河北省秦皇岛市海港区河北大街西段438号	邮编	066004
申请人数量	1	发明人数量	3
申请人所在省	河北省	申请人所在市	河北省秦皇岛市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

北京孚睿湾知识产权代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

韩燕

摘要

本发明提供一种基于信息可见的MEC系统任务调度策略的博弈优化方法，其通过在移动设备中引入决策制定模块DMM，搭建移动边缘计算MEC的系统架构，根据新到达任务的预期逗留时间和预期净效益，DMM做出丢弃任务、将任务分配给本地执行系统LES或通过传输系统TS将任务卸载到MEC服务器的决策。根据在稳态下MEC系统的性能指标并结合数值实验，获得个体最优任务调度策略和社会最优任务调度策略。制定任务在MEC系统中等待时的定价方案，约束调整任务的到达行为，实现个体最优任务调度策略和社会最优任务调度策略的统一。本发明提出的方法解决了移动设备容量不足、性能不佳的问题，在保证每个任务时延最低的同时，最大化运营商和任务整体的利益。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-03-15	授权
2	2021-09-24	实质审查的生效	IPC(主分类): G06F 9/455 专利申请号: 202110661466.6 申请日: 2021.06.15
3	2021-09-07	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，其包括以下步骤：
步骤1：建立基于信息可见的MEC系统，所述基于信息可见的MEC系统包括移动设备和MEC服务器，所述移动设备包括本地执行系统、传输系统和决策制定模块，所述本地执行系统包括一个本地CPU和一个任务缓冲区I，所述传输系统包括一个传输单元和一个任务缓冲区II，所述MEC服务器包括一个任务缓冲区III和c个虚拟机；
步骤2：基于所述步骤1中获得的基于信息可见的MEC系统，根据纯阈值策略获得个体最优任务调度策略，具体步骤为：
步骤21：根据任务在所述步骤1中任务缓冲区I中的等待时间和在本地CPU上的执行时间，获得所述任务被分配到本地执行系统接受服务的逗留时间Dlocal和所述任务在本地执行系统中的预期净效益Glocal；
步骤22：根据所述任务在所述步骤1中任务缓冲区II中的等待时间、在传输单元上的传输时间、在MEC服务器上的执行时间和MEC服务器到移动设备的反馈时间，获得所述任务卸载到MEC服务器接受服务的逗留时间DMEC为：
式中：j为传输系统中的任务数量，所述任务数量包括当前正在接受服务的任务数和在缓冲区II中等待的任务数；w0为任务在MEC服务器上的平均逗留时间；μ2为传输系统中传输单元的服务速率；
所述任务在MEC服务器中的预期净效益GMEC为：
式中：R为任务完成服务后获得的奖励；C为任务在MEC系统中单位时间的逗留成本；
步骤23：基于所述步骤21、步骤22获得的任务在本地执行系统中的预期净效益Glocal、任务在MEC服务器中的预期净效益GMEC，根据纯阈值策略获得个体最优任务调度策略为为本地执行系统中的纯阈值，为传输系统中的纯阈值，i为本地执行系统中的任务数量，所述任务数量包括当前正在接受服务的任务数和在缓冲区I中等待的任务数；所述个体最优任务调度策略S具体为：
S0、当时，所述决策制定模块丢弃新到达的任务；
S1、当或时，如果Glocal＞GMEC，所述决策制定模块将所述新到达的任务分配给所述本地执行系统；
S2、当或时，如果Glocal≤GMEC，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器；
步骤3：基于所述步骤1中获得的基于信息可见的MEC系统，根据最大化净效益的原则获得社会最优任务调度策略，具体为：
当i＝n1，j＝n2时，n1为本地执行系统中的最大任务数，n2为传输系统中的最大任务数，所述决策制定模块丢弃所述新到达的任务，任务调度策略S为S0；
当i＜n1且j＜n2时，如果Glocal＞GMEC，所述决策制定模块将所述新到达的任务分配给所述本地执行系统，所述任务调度策略S为S1；
当i＜n1且j＜n2时，如果Glocal≤GMEC，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器，所述任务调度策略S为S2；
当i＜n1且j＜n2时，所述本地执行系统的任务有效到达率为λ(1‑δ(i,j))，所述传输系统的任务有效到达率为λδ(i,j)，λ为任务有效到达率，λδ(i,j)为任务有效到达率特征函数：
当i＜n1且j＝n2时，所述决策制定模块将所述新到达的任务分配给所述本地执行系统，所述任务调度策略S为1,所述本地执行系统的任务有效到达率为λ，所述传输系统的任务有效到达率为0；
当i＝n1且j＜n2时，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器，所述任务调度策略S为2，所述本地执行系统的任务有效到达率为0，所述传输系统的任务有效到达率为λ；
建立具有两个可数分量的二维连续时间马尔可夫链：
{(L1(t),L2(t)),t≥0}
L1(t)＝i(i＝0,1,…,n1)
L2(t)＝j(j＝0,1,…,n2)
式中：L1(t)为系统水平，表示t时刻本地执行系统中的任务数；L2(t)为系统阶段，表示t时刻传输系统中的任务数；{(L1(t),L2(t)),t≥0}为规则不可约，具有有限的状态空间Ω：
Ω＝{(i,j):0≤i≤n1,0≤j≤n2}
稳态下系统水平为i，系统阶段为j时的概率分布πi,j为：
式中：P{L1(t)＝i,L2(t)＝j}为本地执行系统中任务数为i并且传输系统中的任务数为j时的概率；
根据所述πi,j获得系统水平为i时的稳态概率向量πi为：
所述二维连续时间马尔可夫链{(L1(t),L2(t)),t≥0}的稳态概率分布Π为：
步骤4：根据稳态概率分布和Little定律，获得分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]；基于所述步骤2、步骤3获得的个体最优任务调度策略、社会最优任务调度策略，根据所述分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]获得MEC系统中任务的平均逗留时间E[D]，基于所述个体最优任务调度策略和社会最优任务调度策略，获得个体最优任务调度策略和社会最优任务调度策略的偏差，根据所述偏差制定任务在MEC系统中额外等待费用的定价方案使所述偏差为0。

2.根据权利要求1所述的基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，获得所述步骤22中任务在MEC服务器上的平均逗留时间w0的具体方法为构建函数g(w)：
g(w)＝wactual‑w
α＝λp2
式中：wactual为任务在MEC服务器上的实际平均逗留时间；w为g(w)函数的自变量；α为任务在MEC服务器上的平均到达率；p2为任务通过传输系统分配给MEC服务器的概率；c为虚拟机个数；ρc为具有c个虚拟机的系统的服务强度；ρ为具有1个虚拟机的系统的服务强度；μ3为MEC服务器中虚拟机的服务速率；x！为x的阶乘。

3.根据权利要求2所述的基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，所述步骤4中获得的分配给本地执行系统的任务的平均逗留时间E[Dlocal]为：
式中：p1为任务分配给本地执行系统的概率；为稳态下系统水平为i，系统阶段为n2时的概率分布；
分配给MEC服务器的任务的平均逗留时间E[DMEC]为：
式中：πn1,j为稳态下系统水平为n1，系统阶段为j时的概率分布；
根据所述E[Dlocal]和E[DMEC]获得MEC系统中任务的平均逗留时间E[D]为：
E[D]＝p1E[Dlocal]+p2E[DMEC]。

4.根据权利要求1所述的基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，所述步骤21中获得的任务被分配到本地执行系统接受服务的逗留时间Dlocal为：
式中：μ1为任务在本地执行系统中的本地CPU上的服务率。

5.根据权利要求4所述的基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，所述步骤21中获得的任务在本地执行系统LES中的预期净效益Glocal为：

6.根据权利要求4所述的基于信息可见的MEC系统任务调度策略的博弈优化方法，其特征在于，所述步骤23中获得的个体最优任务调度策略为：
式中：为不大于x的最大整数解。

说明书

技术领域

[0001] 本申请涉及移动边缘计算领域，具体地涉及一种基于信息可见的MEC系统任务调度策略的博弈优化方法。

背景技术

[0002] 随着通信技术的进步和智能移动终端的普及，专门为移动设备设计的能源密集型和计算密集型应用迅速增加，如人脸识别、网络游戏和语音通话。与此同时，人们对更小、更轻的移动设备的需求也越来越大，这将对移动设备的计算能力和电池寿命提出更高的要求。研究表明，移动计算能力和移动电池技术的稳步增长跟不上移动应用计算需求和能源消耗的快速增长，如何填补运行移动应用程序所需的资源与移动设备上提供的可用资源之间的差距是一个巨大的挑战。

[0003] 为了应对这一挑战，近年来提出了许多新的计算范式，如移动云计算，雾计算，Cloudlet和移动边缘计算(Mobile Edge Computing,MEC)。移动设备通过将工作负载卸载到具有计算资源和存储能力的服务器上来增强自身的计算能力和续航能力。移动云计算中的云服务器可以提供高的计算能力、巨大的存储空间，还可以提供可靠的安全性。然而，随着移动终端设备和应用的激增，对带宽、密度、时延等性能指标提出了更高的要求，这意味着移动通信网络要承载比现在多几十倍乃至上千倍的数据量，如果仍采用单一的云计算模式，根本无法保证速度和延迟，更不适合于时间敏感的移动应用。与移动云计算相比，雾计算采用的系统结构更加分布式，更接近网络边缘，其过程发生在局域网(LocalAreaNetwork，LAN)级网络架构上，使用与智能网关和嵌入式计算机系统交互的集中式系统。MEC进一步推进了雾计算的LAN内的处理能力的理念，处理能力更靠近数据源，雾计算不是在中央服务器里整理后实施处理，而是在网络内的各设备实施处理。雾计算和Cloudlet均是云计算的扩展，与云服务器一起工作，而MEC相对独立于云服务器。

[0004] 现有技术中，MEC可以看作是运行在移动网络边缘的云服务器，在靠近移动用户的无线接入网络中提供计算、存储和处理能力，充分发挥低延迟和高带宽的优点。将任务从本地移动设备卸载到附近资源丰富的MEC服务器可以增强移动设备的计算能力，延长移动设备的续航时间。然而任务从移动设备到MEC服务器的卸载过程会消耗能量并且占用网络带宽。将太多的任务卸载到MEC服务器上不仅消耗大量的能量，而且还会造成网络拥塞，导致更高的时间延迟。

发明内容

[0005] 为了克服现有技术的不足，本发明的目的是提出一种基于信息可见的MEC系统任务调度策略的博弈优化方法，该方法基于本地设备信息可见，提出一个具有多虚拟机的MEC架构，构建基于本地设备信息可见的多虚拟机排队模型。基于该MEC系统，决策制定模块(Decision makingmodule，DMM)分别从个体视角和系统视角研究个体最优任务调度策略和社会最优任务调度策略，获得基于信息可见MEC系统的任务调度策略的定价方案，使个人的最优阈值策论和社会的一致。该卸载策略能够解决移动设备容量不足、性能不佳的问题，利用该卸载测量在保证每个任务时延最低的同时，能够最大化运营商和任务整体的利益。

[0006] 为实现上述目的，本发明所采用的解决方案为：

[0007] 一种基于信息可见的MEC系统任务调度策略的博弈优化方法，其包括以下步骤：

[0008] 步骤1：建立基于信息可见的MEC系统，所述基于信息可见的MEC系统包括移动设备和MEC服务器，所述移动设备包括本地执行系统、传输系统和决策制定模块，所述本地执行系统包括一个本地CPU和一个任务缓冲区I，所述传输系统包括一个传输单元和一个任务缓冲区II，所述MEC服务器包括一个任务缓冲区III和n个虚拟机；

[0009] 步骤2：基于所述步骤1中获得的基于信息可见的MEC系统，根据纯阈值策略获得个体最优任务调度策略，具体步骤为：

[0010] 步骤21：根据任务在所述步骤1中任务缓冲区I中的等待时间和在本地CPU上的执行时间，获得所述任务被分配到本地执行系统接受服务的逗留时间Dlocal和所述任务在本地执行系统中的预期净效益Glocal；

[0011] 步骤22：根据所述任务在所述步骤1中任务缓冲区II中的等待时间、在传输单元上的传输时间、在MEC服务器上的执行时间和MEC服务器到移动设备的反馈时间，获得所述任务卸载到MEC服务器接受服务的逗留时间DMEC为：

[0012]

[0013] 式中：j为传输系统中的任务数量，所述任务数量包括当前正在接受服务的任务数和在缓冲区II中等待的任务数；w0为任务在MEC服务器上的平均逗留时间；μ2为传输系统中传输单元的服务速率；

[0014] 所述任务在MEC服务器中的预期净效益GMEC为：

[0015]

[0016] 式中：R为任务完成服务后获得的奖励；C为任务在MEC系统中单位时间的逗留成本；

[0017] 步骤23：基于所述步骤21、步骤22获得的任务在本地执行系统中的预期净效益Glocal、任务在MEC服务器中的预期净效益GMEC，根据纯阈值策略获得个体最优任务调度策略为为本地执行系统中的纯阈值，为传输系统中的纯阈值，i为本地执行系统中的任务数量，所述任务数量包括当前正在接受服务的任务数和在缓冲区I中等待的任务数；所述个体最优任务调度策略具体为：

[0018] 当时，所述决策制定模块丢弃新到达的任务；

[0019] 当或时，如果Glocal＞GMEC，所述决策制定模块将所述新到达的任务分配给所述本地执行系统；

[0020] 当或时，如果Glocal≤GMEC，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器；

[0021] 步骤3：基于所述步骤1中获得的基于信息可见的MEC系统，根据最大化净效益的原则获得社会最优任务调度策略，具体为：

[0022] 当i＝n1，j＝n2时，n1为本地执行系统中的最大任务数，n2为传输系统中的最大任务数，所述决策制定模块丢弃所述新到达的任务，任务调度策略S为0；

[0023] 当i＜n1且j＜n2时，如果Glocal＞GMEC，所述决策制定模块将所述新到达的任务分配给所述本地执行系统，所述任务调度策略S为1；

[0024] 当i＜n1且j＜n2时，如果Glocal≤GMEC，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器，所述任务调度策略S为2；

[0025] 当i＜n1且j＜n2时，所述本地执行系统的任务有效到达率为λ(1‑δ(i,j))，所述传输系统的任务有效到达率为λδ(i,j)，λ为任务有效到达率，δ(i,j)为任务有效到达率特征函数：

[0026]

[0027] 当i＜n1且j＝n2时，所述决策制定模块将所述新到达的任务分配给所述本地执行系统，所述任务调度策略S为1,所述本地执行系统的任务有效到达率为λ，所述传输系统的任务有效到达率为0；

[0028] 当i＝n1且j＜n2时，所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器，所述任务调度策略S为2，所述本地执行系统的任务有效到达率为0，所述传输系统的任务有效到达率为λ；

[0029] 建立具有两个可数分量的二维连续时间马尔可夫链：

[0030] {(L1(t),L2(t)),t≥0}

[0031] L1(t)＝i(i＝0,1,…,n1)

[0032] L2(t)＝j(j＝0,1,...,n2)

[0033] 式中：L1(t)为系统水平，表示t时刻本地执行系统中的任务数；L2(t)为系统阶段，表示t时刻传输系统中的任务数；{(L1(t),L2(t)),t≥0}为规则不可约，具有有限的状态空间Ω：

[0034] Ω＝{(i,j):0≤i≤n1,0≤j≤n2}

[0035] 稳态下系统水平为i，系统阶段为j时的概率分布πi,j为：

[0036]

[0037] 式中：P{L1(t)＝i,L2(t)＝j}为本地执行系统中任务数为i并且传输系统中的任务数为j时的概率；

[0038] 根据所述πi,j获得系统水平为i时的稳态概率向量πi为：

[0039]

[0040] 所述二维连续时间马尔可夫链{(L1(t),L2(t)),t≥0}的稳态概率分布Π为：

[0041]

[0042] 步骤4：根据稳态概率分布和Little定律，获得分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]；基于所述步骤2、步骤3获得的个体最优任务调度策略、社会最优任务调度策略，根据所述分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]获得MEC系统中任务的平均逗留时间E[D]，基于所述个体最优任务调度策略和社会最优任务调度策略，获得个体最优任务调度策略和社会最优任务调度策略的偏差，根据所述偏差制定任务在MEC系统中额外等待费用的定价方案使所述偏差为0。

[0043] 可优选的是，获得所述步骤22中任务在MEC服务器上的平均逗留时间w0的具体方法为构建函数g(w)：

[0044] g(w)＝wactual‑w

[0045]

[0046] α＝λp2

[0047] 式中：wactual为任务在MEC服务器上的实际平均逗留时间；w为g(w)函数的自变量；α为任务在MEC服务器上的平均到达率；p2为任务通过传输系统分配给MEC服务器的概率；c为虚拟机个数；ρc为具有c个虚拟机的系统的服务强度；ρ为具有1个虚拟机的系统的服务强度；μ3为MEC服务器中虚拟机的服务速率；

[0048] 计算g(w)的零点g(w0)＝0，获得任务在MEC服务器上的平均逗留时间w0，具体为：

[0049] if g(wmax)*g(wmin)≤0

[0050] while(true)

[0051] if abs(g(wmean))≤accuracy

[0052] w0＝wmean；

[0053] break；

[0054] endif

[0055] if g(wmin)*g(wmean)＞0

[0056] wmin＝wmean；

[0057] elseif g(wmin)*g(wmean)＜0

[0058] wmax＝wmean；

[0059] endif

[0060]

[0061] endif

[0062] 式中：wmax为初始化任务在MEC服务器上平均逗留时间的最大值；wmin为初始化任务‑20在MEC服务器上平均逗留时间的最小值；accuracy为精度，accuracy＝e ；wmean为初始化任务在MEC服务器上平均逗留时间的平均值：

[0063] wmean＝(wmax+wmin)/2。

[0064] 可优选的是，所述步骤4中获得的分配给本地执行系统的任务的平均逗留时间E[Dlocal]为：

[0065]

[0066]

[0067] 式中：p1为任务分配给本地执行系统的概率；为稳态下系统水平为i，系统阶段为n2时的概率分布；

[0068] 分配给MEC服务器的任务的平均逗留时间E[DMEC]为：

[0069]

[0070]

[0071] 式中：为稳态下系统水平为n1，系统阶段为j时的概率分布；

[0072] 根据所述E[Dlocal]和E[DMEC]获得MEC系统中任务的平均逗留时间E[D]为：

[0073] E[D]＝p1E[Dlocal]+p2E[DMEC]。

[0074] 可优选的是，所述步骤21中获得的任务被分配到本地执行系统接受服务的逗留时间Dlocal为：

[0075]

[0076] 式中：μ1为任务在本地执行系统中的本地CPU上的服务率。

[0077] 可优选的是，所述步骤21中获得的任务在本地执行系统LES中的预期净效益Glocal为：

[0078]

[0079] 可优选的是，所述步骤23中获得的个体最优任务调度策略为：

[0080]

[0081]

[0082]

[0083] 式中：为不大于x的最大整数解。

[0084] 与现有技术相比，本发明的有益效果在于：

[0085] 针对实时型任务，令虚拟机个数固定且始终处于活跃状态，提出了一个由移动设备和和具有多个虚拟机的MEC服务器组成的具有多个虚拟机的MEC架构。根据本地设备中的任务数，利用二分法求解任务的预期逗留时间，为每个任务构建效益函数，研究个体最优任务调度策略。基于本地设备信息可见，构建了多虚拟机排队模型，构建二维连续时间马尔可夫链，对系统进行稳态分析，求解了稳态下任务的平均响应时间，构建了社会效益函数，研究社会最优任务调度策略。该卸载策略解决了移动设备容量不足、性能不佳的问题，使用该卸载测量能够在保证每个任务时延最低的同时，最大化运营商和任务整体的利益。

实施方案

[0090] 以下，参照附图对本发明的实施方式进行说明。

[0091] 本发明实施例提供了一种基于信息可见的MEC系统任务调度策略的博弈优化方法，如图1所示，具体步骤包括：

[0092] 如图2所示，基于信息可见的MEC系统包括移动设备、MEC服务器两个部分：

[0093] 移动设备中的本地执行系统(Local Execution System，LES)：由一个本地CPU和一个任务缓冲区I组成。当任务进入LES时，如果本地CPU空闲，则任务立即接受服务。否则任务将在缓冲区I中排队等待。一旦在本地CPU中执行的任务完成服务并离开LES，在缓冲区I队首排队等待的任务将立即占用本地CPU并获得服务。

[0094] 移动设备中的传输系统(Transmission System，TS)：由一个传输单元(Transmission Unit，TU)和一个任务缓冲区II组成。缓冲区II中的任务通过TU逐个传输到MEC服务器接收类似云的服务。如果TU是空闲的，则立即传输新到达的任务。否则，任务必须在缓冲区II中排队等待。一旦TU恢复空闲，位于缓冲区II队首的任务将占用TU并开始传输。

[0095] MEC服务器：由一个任务缓冲区III和有限个虚拟机组成。任务从TS卸载到MEC服务器后，若有空闲的虚拟机，则立即占用并接受服务；若全部虚拟机均被占用，则该任务进入到缓冲区III中排队等待，一旦出现空闲虚拟机，排在缓冲区III队首的任务则立即占用该虚拟机接受服务。

[0096] 在上述MEC系统中，任务的卸载策略如下：

[0097] 根据本地设备的可见信息，DMM获得任务被分配到LES和被卸载到MEC服务器中接受服务的净效益，以最大化任务净效益的原则制定任务调度策略，提出个体最优任务调度策略，这里所说的本地设备的可见信息包括移动设备上LES和TS中的任务数量可见。

[0098] 基于本地设备信息可见的个体净效益表示如下：

[0099] 任务被分配到LES接受服务的逗留时间包括在缓冲区I中的等待时间和在本地CPU上的执行时间。当LES中已经有i个任务时，这里的任务包括当前正在接受服务的任务数和在缓冲区I中等待的任务数，将新到达任务分配给LES的预期逗留时间可表示为Dlocal。

[0100]

[0101] 其中：μ1为LES中本地CPU上的服务速率；

[0102] 相应地，该任务的预期净效益可表示为Glocal。

[0103]

[0104] 其中：R为任务完成服务后获得的奖励；C为任务在MEC系统中单位时间的逗留成本；

[0105] 将任务卸载到MEC服务器接受服务的逗留时间包括在缓冲区II中的等待时间、TU上的传输时间、MEC服务器上的执行时间以及MEC服务器到移动设备的反馈时间。与云服务器相比，MEC服务器离移动设备更近，而且MEC系统中的流量负载比较轻。因此，在计算任务被卸载到MEC服务器接受服务的逗留时间时，忽略了反馈时间。

[0106] 当TS中已经有j个任务时，这里的任务包括当前正在接受服务的任务数和在缓冲区II中等待的任务数，新到达任务在缓冲区II中的等待时间和TU上的传输时间之和是(j+1)/μ2，任务在MEC服务器上的平均逗留时间表示为w0。因此，将新到达任务卸载到MEC服务器的预期逗留时间可表示为DMEC。

[0107]

[0108] 其中：μ2为TS中TU的服务速率；

[0109] 相应地，该任务的预期净效益可表示为GMEC。

[0110]

[0111] 当任务的预期净效益Glocal和GMEC的值均是负数时，即R‑C(i+1)/μ1＜0并且R‑C((j+1)/μ2+w0)＜0，新到达的任务将被丢弃。否则，LES和TS中分别存在一个纯阈值策略。

[0112] 设为LES中的纯阈值策略。是小于或等于Rμ1/C的最大整数，即设为TS中的纯阈值策略。是小于或等于Rμ2/C‑μ2w0的最大整数，即
因此，MEC系统的个体最优阈值策略可表示为

[0113]

[0114] 式中：为不大于x的最大整数解。

[0115] 也就是说，当LES中有个任务并且TS中有个任务时，即且 DMM将丢弃新到达的任务。当LES中的任务少于或者TS中的任务少于时，即或 DMM以最大化预期净效益的原则分配新到达的任务。如果任务在LES上接受服务的预期净效益大于在MEC服务器上的预期净效益，即Glocal＞GMEC，DMM将此任务分配给LES。否则，DMM将通过TS将此任务卸载到MEC服务器。

[0116] 如图3所示，社会最优任务调度策略为：

[0117] (1)当LES中有n1个任务且TS中有n2个任务时，即i＝n1且j＝n2，DMM将丢弃新到达的任务，任务调度策略是S＝0。

[0118] (2)当LES中的任务数少于n1且TS中的任务数少于n2时，即i＜n1且j＜n2，DMM以最大化预期净效益的原则分配新到达的任务。如果Glocal＞GMEC，DMM将到达的任务分配给LES，任务调度策略是S＝1。在这种情况下，LES和TS的任务有效到达率分别是λ和0。否则，DMM将通过TS将此任务卸载到MEC服务器，任务调度策略是S＝2。在这种情况下，任务在LES和TS的有效到达率分别是0和λ。

[0119] 通过引入一个特征函数如公式(6)给出任务的有效到达率。

[0120]

[0121] 当i＜n1且j＜n2时，任务在LES的有效到达率为λ(1‑δ(i,j))，任务在TS的有效到达率为λδ(i,j)。

[0122] (3)当LES中的任务数少于n1且TS中的任务数为n2时，即i＜n1且j＝n2，DMM只能将新到达的任务分配给LES，任务调度策略是S＝1。在这种情况下，任务在LES和TS的有效到达率分别是λ和0。

[0123] (4)当LES中的任务数为n1且TS中任务数少于n2时，即i＝n1且j＜n2，DMM只能通过TS将新到达的任务卸载到MEC服务器，任务调度策略是S＝2。在这种情况下，任务在LES和TS的有效到达率分别是0和λ。

[0124] 令随机变量L1(t)＝i(i＝0,1,...,n1)和L2(t)＝j(j＝0,1,...,n2)分别表示t时刻LES中和TS中的任务数。建立具有两个可数分量的二维连续时间马尔可夫链{(L1(t),L2(t)),t≥0}，其中L1(t)称为系统水平，L2(t)称为系统阶段。{(L1(t),L2(t)),t≥0}是规则不可约的，具有有限的状态空间Ω为：

[0125] Ω＝{(i,j):0≤i≤n1,0≤j≤n2} (7)

[0126] 定义πi,j为稳态下系统水平为i，系统阶段为j时的概率分布，πi,j表示为：

[0127]

[0128] 定义πi为系统水平是i时的稳态概率向量，πi可表示为：

[0129]

[0130] 二维连续时间马尔可夫链{(L1(t),L2(t)),t≥0}的稳态概率分布Π可以表示为：

[0131]

[0132] 考虑任务到达率λ，一个任务在LES中本地CPU上的服务率为μ1，TS中TU上的传输率为μ2。MEC服务器中有c个相同的虚拟机，任务在虚拟机上的服务率为μ3，运用排队论、通信原理和计算机组成等理论知识，求解任务在MEC服务器上的平均逗留时间w0。

[0133] MEC服务器可以视为一个M/M/c的排队系统，令w0表示稳定状态下，任务在MEC服务器上的平均逗留时间。由于任务在MEC服务器上的实际到达率无法直接获知，因此w0无法直接用数学表达式表示。

[0134] 在基于本地设备可见的排队系统中，任务在MEC服务器上平均逗留时间与任务在MEC服务器上的到达率相互影响，在MEC服务器上的平均逗留时间越长，任务在MEC服务器上的到达率就越小，反之越大；任务在MEC服务器上的到达率越小，在MEC服务器上的平均逗留时间就越小，反之越大。所以，在系统稳定状态下，w0一定存在唯一解。

[0135] 为了求解稳态下任务在MEC服务器上的平均逗留时间，构建函数g(w)，其构建步骤如下。

[0136] (1)假设任务在MEC服务器上的平均逗留时间用w表示；

[0137] (2)对具有多个虚拟机的MEC系统进行稳态分析，获得任务在MEC服务器上的平均到达率α为：

[0138] α＝λp2 (11)

[0139] 式中：p2为任务通过传输TS分配给MEC服务器的概率；

[0140] 计算任务在MEC服务器上的实际平均逗留时间wactual：

[0141]

[0142] 其中：wactual为任务在MEC服务器上的实际平均逗留时间；w为g(w)函数的自变量；c为虚拟机个数；ρc为具有c个虚拟机的系统的服务强度；ρ为具有1个虚拟机的系统的服务强度；μ3为MEC服务器中虚拟机的服务速率。

[0143] (3)构建函数g(w)可表示g(w)。

[0144] g(w)＝wactual‑w (13)

[0145] (4)输出g(w)。

[0146] 根据上述对任务在MEC服务器上逗留时间与任务在MEC服务器上到达率之间关系的描述可知，g(w)是一个递减函数并且存在零点值，当w与wactual相同，即g(w)＝0时，w即是系统稳定状态下，任务在MEC服务器上的平均逗留时间。因此将求解系统稳态下任务在MEC服务器上的平均逗留时间问题转化为求解g(w)的零点问题。

[0147] 任务在MEC服务器上的平均逗留时间w0的步骤如下。

[0148] (1)初始化任务在MEC服务器上平均逗留时间的最大值wmax、最小值wmin，精度‑20accuracy＝e 。

[0149] (2)计算平均值wmean＝(wmax+wmin)/2，g(w)函数的最大值g(wmin)，平均值g(wmean)和最小值g(wmax)；

[0150] (3)计算g(w)的零点g(w0)＝0。

[0151] if g(wmax)*g(wmin)≤0

[0152] while(true)

[0153] if abs(g(wmean))≤accuracy

[0154] w0＝wmean；

[0155] break；

[0156] endif

[0157] if g(wmin)*g(wmean)＞0

[0158] wmin＝wmean；

[0159] elseif g(wmin)*g(wmean)＜0

[0160] wmax＝wmean；

[0161] endif

[0162]

[0163] endif

[0164] (4)输出w0。

[0165] 求解分配给LES的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]。

[0166] 分配给LES的任务的平均逗留时间E[Dlocal]包括在缓冲区I中的平均逗留时间和在LES上的平均服务时间。

[0167]

[0168] 其中：p1为任务分配给本地执行系统的概率；

[0169]

[0170] 其中：为稳态下系统水平为i，系统阶段为n2时的概率分布；

[0171] 分配给MEC服务器的任务的平均逗留时间E[DMEC]包括在缓冲区II中的平均逗留时间、在TS上的平均服务时间和在MEC服务器上的平均服务时间。

[0172]

[0173]

[0174] 其中：为稳态下系统水平为n1，系统阶段为j时的概率分布；

[0175] 结合E[Dlocal]和E[DMEC]给出MEC系统中任务的平均逗留时间E[D]：

[0176] E[D]＝p1E[Dlocal]+p2E[DMEC] (18)

[0177] 社会效益是MEC系统中所有任务净效益和运营商效益的总和。考虑到提供服务的MEC系统，单位时间社会效益S(n1,n2)表示为：

[0178]

[0179] 其中：是任务在MEC系统的有效到达率；为稳态下系统水平为n1，系统阶段为n2时的概率分布；

[0180] 通过最大化公式S(n1,n2)中给出的单位时间社会效益S(n1,n2)，社会最优任务调度策略＝表示为：

[0181]

[0182] 其中：argmax表示最大化目标函数的变量集。换句话说，来自argmax的任何元素都使单位时间社会效益S(n1,n2)达到其最大价值。

[0183] 提供一具体实施例，如图4所示，针对移动设备中的任务卸载问题，利用本发明提出的策略，可以在保证每个任务时延最低的同时，实现社会效益函数达到最大值。图4揭示了系统视角下的DMM任务调度策略的社会效益情况，获得MEC系统的社会最优任务调度策略X轴代表LES中的阈值，Y轴代表TS中的阈值，Z轴代表在LES中的阈值和TS中的阈值确定的情况下对应的单位时间社会效益值。

[0184] 当LES中的阈值n1和TS中的阈值n2都较小时，新到达的任务更有可能在没有获得服务的情况下被丢弃，这是限制单位时间社会效益S(n1,n2)的一个主要因素。随着LES中的阈值n1或TS中的阈值n2的增加，单位时间社会效益S(n1,n2)将相应增加。然而，当LES中的阈值n1或TS中的阈值n2进一步增加时，更多的任务将进入MEC系统，平均逗留时间E[D]将更大。因此，在MEC系统中逗留的时间成本将降低单位时间社会效益S(n1,n2)。从总体上看，单位时间社会效益S(n1,n2)呈现出凸的趋势。

[0185] 通过观察图4还发现，总是存在一个双元组它可以使单位时间社会效益S(n1,n2)最大化。二元组称为社会最优任务调度策略。在设置的系统参数下，MEC系统的社会最优任务调度策略是(4,8)。

[0186] 与现有技术相比，本发明提出的基于信息可见的MEC系统任务调度策略的博弈优化方法，能够解决移动设备容量不足、性能不佳的问题，在保证每个任务时延最低的同时，最大化运营商和任务整体的利益。

[0187] 以上所述的实施例仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

附图说明

[0086] 图1为本发明实施例的基于信息可见的MEC系统任务调度策略的博弈优化方法的流程框图；

[0087] 图2为本发明实施例的基于信息可见MEC系统组成的结构示意图；

[0088] 图3为本发明实施例中基于信息可见MEC系统的任务调度策略的流程图；

[0089] 图4为本发明实施例中基于信息可见MEC系统的系统视角下的DMM任务调度策略的社会效益情况。

1基于信息可见的MEC系统任务调度策略的博弈优化方法