首页 创业指南 致富视频 网上开店 养殖视频 范文大全 创业项目开店经验创业杂谈如何创业技术资料创业防骗项目分析微信营销农村创业投资理财
  • 大学生创业
  • 百姓创业故事
  • 农村创业故事
  • 网络创业故事
  • 特殊职业创业
  • 致富经创业故事
  • 网络切片场景下基于分布式生成对抗网络的服务功能链异常检测

    时间:2023-02-28 11:25:06 来源:东东创业网 本文已影响 东东创业网手机站

    相关热词搜索:

    唐 伦 王 恺 张 月 周鑫隆 陈前斌

    (重庆邮电大学通信与信息工程学院 重庆 400065)

    (重庆邮电大学移动通信重点实验室 重庆 400065)

    网络切片依托软件定义网络(Software-Defined Networking, SDN)和网络功能虚拟化(Network Function Virtualization, NFV)成为5G网络中的关键技术,可实现对网络资源的灵活部署[1]。针对不同服务请求,按照特定顺序将虚拟网络功能(Virtualized Network Function, VNF)通过虚拟链路连接构成服务功能链(Service Function Chaining,SFC),可为网络提供多样化服务。SDN和NFV技术使网络更灵活的同时,网络故障点及故障类型随之增加,使得网络管理环境更加复杂。因此,对网络切片及时检测、判断其异常情况尤为重要[2]。

    在动态网络环境中,定制化网络服务能否正常运行依托于SFC的状态。Sauvanaud等人[3]使用随机森林对VNF的行为进行分类,通过检测其违反服务等级协议(Service-Level Agreement, SLA)的症状完成对VNF的故障检测。Cotroneo等人[4]通过关联SFC中VNF间的性能指标来推断该SFC的运行状况。Blaise等人[5]通过马尔可夫链确定VNF顺序,进而使用K均值聚类算法确定SFC是否存在异常行为。

    上述文献均未考虑数据类不平衡的问题,因此考虑使用生成对抗网络(Generative Adversarial Networks, GAN)进行异常检测,而现有方法大多用于图像领域。Bashar等人[6]提出了基于GAN的时间序列异常检测方法(Time series Anomaly detection with GAN, TAnoGAN),但在每次异常检测时需要将数据重新映射到潜在空间中,计算复杂度高且计算量较大。

    针对上述存在的问题,本文提出一种基于分布式GAN的时间序列异常检测模型(Distributed Time Series GAN, DTSGAN)。本文的主要工作和创新点总结如下:

    首先,使用GAN学习SFC中正常数据的特征,可解决在模型训练时SFC中数据类不平衡的问题,本文提出分布式GAN架构,通过构建分布式生成器和单个鉴别器的网络模型,使分布式生成器分别学习SFC中每个VNF的数据特征,从而可对数据重构,实现采用分布式生成器进行异常检测的目的。

    其次,本文针对时间序列数据构建了一种基于滑动窗口数据特征提取器,通过提取数据的范数和曼哈顿距离这两种衍生特性,捕获数据时间窗内和时间窗之间的特征,再通过提取平均值、最小值、最大值等8种统计特征以挖掘数据的深层次特征,得到原始数据的特征序列,易于模型学习数据特征。

    最后,为使每个分布式生成器能够学习并重构正常数据的特征,提出时间卷积网络(Temporal Convolutional Networks, TCN)与自动编码器(Auto Encoder, AE)构建的3层编解码器作为分布式生成器,分布式生成器可通过异常得分函数衡量重构数据与输入数据之间的差异以检测VNF的状态,进而完成对SFC的异常检测。本文通过仿真验证了DTSGAN异常检测模型的有效性。

    网络切片管理场景如图1所示,在网络切片场景中,一条SFC由多个VNF通过虚拟链路连接构成。当物理节点2发生异常时,运行在该节点上的VNF1和VNF2性能会受到影响,进而会影响包含该VNF的SFC的性能。因此,采用分布式架构对SFC中包含的每个VNF进行独立检测十分重要。

    图1 网络切片管理场景

    在实际网络中,正常数据量远多于异常数据量。为解决训练过程中SFC数据类不平衡的问题,同时对SFC中VNF的状态进行感知,本文使用GAN对数据特征进行学习,仅使用正常数据进行训练以解决数据类不平衡的问题,并提出基于分布式GAN的异常检测模型,该模型在每个VNF的网元管理器(Element Management, EM)中部署生成器模块,在NFV管理与编排(MANagement and Orchestration, MANO)的虚拟化网络功能管理器(VNF Manager, VNFM)中部署鉴别器模块,为每个SFC构造多个生成器和单个鉴别器的分布式GAN,通过检测分布式VNF中的异常完成对与其相关联的SFC的异常检测,DTSGAN模型架构如图2所示。

    图2 DTSGAN模型架构

    DTSGAN模型的整体流程如图3所示,主要包含训练和测试两个阶段。

    图3 DTSGAN模型整体流程

    在训练阶段,DTSGAN模型只使用正常数据进行训练。首先,在每个EM中使用特征提取器对原始时间序列进行特征提取,计算数据中的衍生特性和统计特征。之后,将特征序列输入到生成器模块中,对数据进行重构。然后,将每个EM中产生的特征序列与重构序列输入到鉴别器模块中,使用鉴别器对特征序列与重构序列进行鉴别,并反馈参数供生成器模块优化调整,使得每个EM中的生成器模块能够重构正常数据特征,得到可识别正常数据特征的分布式生成器。

    在测试阶段,只使用每个EM的生成器模块进行异常检测。将测试数据输入至EM的生成器模块中,若测试数据为正常数据,则生成器模型能对其特征进行重构,即获得较低的异常得分;
    反之,重构数据时会产生较大的偏差,获得较高的异常得分,即可认为EM中数据存在异常,从而完成对SFC中包含的每个VNF进行独立的异常检测。

    3.1 问题公式化

    3.2 特征提取器

    通常时间序列数据之间都具有相关性,是相互依赖的,通过滑动窗口提取特征丰富的数据更有助于模型针对具代表性的特征进行训练,提高模型的泛化能力[7]。

    在本文中,特征提取器包含两个步骤:计算衍生特性和计算统计特征。

    3.2.1 计算衍生特性

    为了更好地反映出每个时间窗中原始时间序列数据内部和相邻时间窗之间的关系,在每个时间窗内计算原始时间序列数据的两个衍生特性:范数(norm)和曼哈顿距离(Manhattan distance)。范数可以捕获同一个时间窗口内数据之间的特征,可对数据的大小及长度进行度量,用NR表示。曼哈顿距离可衡量两个时间窗之间的差异,用MD表示。

    3.2.2 计算统计特征

    根据文献[7]中建议,为每个衍生特性选取8个统计特征对其进行描述:平均值(MEAN)、最小值(MIN)、最大值(MAX)、第1四分位数(Q1)、第2四分位数(Q2)、第3四分位数(Q3)、标准差(STD)和极差(R),从而衡量数据的集中趋势和离散程度。在本文中,分别为NR和MD计算上述8个统计特征,如图4所示。

    图4 特征提取步骤

    3.3 DTSGAN模型训练

    为检测SFC中每个VNF的异常情况,DTSGAN模型在训练阶段由部署在MANO上的鉴别模块和VNF上EM的生成模块交互执行,训练过程需进行多次全局迭代,具体包含如下步骤:

    算法1 DTSGAN在MANO中的训练

    3.4 DTSGAN模型异常检测

    4.1 仿真设置

    本实验使用Python及Pytorch 1.7.1在基于CPU的计算机上实现DTSGAN模型的编写和运行,该计算机采用Intel(R) Core(TM) i7-6700 CPU。仿真过程中,在虚拟网络层中的6个VNF的EM上部署生成器,并在NFV MANO中的VNFM上部署1个鉴别器,以构建分布式生成对抗网络DTSGAN模型。为验证本文所提模型的可行性,选择开源的VNF数据集Clearwater作为实验数据集进行试验评估[10],并使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数(F1 Score)对所提模型的性能进行验证。

    算法2 DTSGAN在E Mi中的训练

    4.1.1 DTSGAN模型设置

    鉴别器D由MLP构成,它由1个输入层和1个输出层组成,其中F和z分别有2个输入通道(每个输入通道包含128个神经元),隐藏层包含128个神经元,输出层包含1个神经元。

    此外,本实验采用Adam优化器对DTSGAN框架进行训练,学习率和训练轮数分别为0.0003和500,训练批次大小为100。

    4.1.2 对比方案设置

    在本实验中,首先DTSGAN模型根据表1设置滑动窗口尺寸并对比不同尺寸的性能指标值,以找到最优的滑动窗口尺寸。进一步,本实验将与双向生成对抗网络(Bidirectional Generative Adversarial Networks, BiGAN)[11]、长短期记忆自编码器生成对抗网络(Long Short-Term Memory-AE GAN,LSTM-AE GAN)以及深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Network,DCGAN)[12]3种网络异常检测方案的稳定性进行对比,并分别对比在有无特征提取时3种网络的异常检测性能。

    表1 滑动窗口尺寸设置

    4.2 结果与分析

    本实验在DTSGAN模型的训练过程中,部署在6个VNF的EM上的分布式生成器不断与部署在VNFM上的鉴别器进行对抗,鉴别器损失函数和生成器损失函数的变化情况如图5所示。从中可看出,随着训练轮次的增加,鉴别器损失在下降的过程中仍存在轻微的波动。当训练轮次达到500时,鉴别器损失和生成器损失都逐渐趋于平稳,说明DTSGAN模型的损失函数在训练中可以很好地收敛,即经过训练后该模型可获得最优的鉴别器和生成器用于网络的异常检测。

    图5 损失函数

    为了找到DTSGAN模型中特征提取器的最优滑动窗口尺寸,本实验根据表1设置不同的滑动窗口尺寸,并取6个VNF的均值表示SFC的性能。图6为不同设置下网络的准确率、精确率、召回率和F1分数。图6横坐标中s表示衍生特性滑动窗口尺寸,f表示统计特征滑动窗口尺寸。从中可看出,随着s和f的增加,网络的准确率、精确率、召回率及F1分数4个性能指标都呈现上升趋势,并且在s=14,f=10时,4个性能指标都达到最大值。在滑动窗口尺寸继续增加至s=14,f=12时,4个性能指标均呈现下降趋势。由此可知,s和f的不同设置会影响网络性能,当设置为s=14,f=10时,可使得模型的检测性能最优。

    图6 滑动窗口尺寸对性能指标的影响

    图7所示为未特征提取数据和特征提取数据分别在BiGAN, LSTM-AE GAN, DCGAN以及DTSGAN模型下,网络的准确率、精确率、召回率及F1分数4个性能指标。由图可知,相比于网络输入数据为未进行特征提取的数据,采用经过特征提取的数据作为输入数据,4个网络模型的性能指标能够提升1.5%~4.9%,因此,在VNF异常检测中使用含有丰富特征的数据能够提升网络的异常检测性能。同时,DTSGAN模型的准确率、精确率、召回率及F1分数4个性能均高于96%,且4个性能指标都优于其他3个对比方案。

    48ccd783f59.webp"/>

    图7 4种方案性能指标对比

    在VNF的异常检测中,异常检测性能的稳定性也十分重要。图8分别展示了4种算法进行10次测试的准确率、精确率、召回率及F1分数4个性能指标。从中可看出,相比于DCGAN,其他3个网络模型的4个性能指标的波动较小、较为稳定,这是由于在DTSGAN, LSTM-AE和BiGAN中都使用了编解码器提取数据的潜在表示并对其进行重构,使得网络模型能够更好地学习到数据特征。同时DTSGAN模型采用TCN构建的3层编解码器作为生成器,可使得网络的性能指标的均值达96%以上。

    图8 算法稳定性对比

    本文在网络切片场景下,针对SFC的异常检测问题,提出一种基于分布式GAN的时间序列异常检测模型。使用GAN学习SFC中正常数据的特征,解决在模型训练时SFC中数据类不平衡的问题,同时,为独立检测SFC中每个VNF的状态,提出了分布式GAN架构,构建基于滑动窗口的数据特征提取器获得原始数据的特征序列,使用TCN与AE构建的3层编解码器作为生成器,提取特征序列的潜在表示并对其进行重构,通过生成器与鉴别器的不断对抗提高生成器学习正常数据特征的能力,使用异常得分函数衡量重构数据与输入数据之间的差异以检测VNF的状态,进而完成对SFC的异常检测。仿真结果表明,本模型有较好的稳定性,同时能获得较高的检测精度。

    猜你喜欢 鉴别器特征提取分布式 基于多鉴别器生成对抗网络的时间序列生成模型通信学报(2022年10期)2023-01-09基于双鉴别器生成对抗网络的单目深度估计方法北京工业大学学报(2022年9期)2022-09-15基于Gazebo仿真环境的ORB特征提取与比对的研究电子制作(2019年15期)2019-08-27基于Daubechies(dbN)的飞行器音频特征提取电子制作(2018年19期)2018-11-14分布式光伏热钱汹涌能源(2017年10期)2017-12-20分布式光伏:爆发还是徘徊能源(2017年5期)2017-07-06Bagging RCSP脑电特征提取算法自动化学报(2017年11期)2017-04-04基于DDS的分布式三维协同仿真研究雷达与对抗(2015年3期)2015-12-09基于MED和循环域解调的多故障特征提取噪声与振动控制(2015年4期)2015-01-01西门子 分布式I/O Simatic ET 200AL自动化博览(2014年12期)2014-02-28
    • 创业指南
    • 网上开店
    • 养殖视频
    • 理财
    • 政策
    • 技术
    • 致富视频

    推荐访问