易妖游戏网
您的当前位置:首页基于云计算和物联网的网络大数据技术研究

基于云计算和物联网的网络大数据技术研究

来源:易妖游戏网
文章编号:1671—4598(2017)11—0183—03 DOI:10.16526/j.cnki.11--4762/tp.2017.11.046 中图分类号:TP311.13 文献标识码:A 基于云计算和物联网的网络大数据技术研究 姜迪清,张丽娜 (浙江安防职业技术学院,浙江温州 325000) 摘要:为了使网络大数据应用的范围更广,更大程度地提高网络数据存储与管理精度,减少网络数据处理与控制的时间,需要对网 络大数据进行研究;当前的网络大数据研究方法多是采用Hadoop基础架构对网络大数据进行研究,在数据存储中没有设定具体的安全 存储指标,无法得到数据安全存储指标权重,存在数据存储安全性能低,网络大数据研究精度偏差大等问题f为此,提出一种基于云计 算和物联网的网络大数据研究方法;该方法首先利用分级网络编码对网络数据进行传输,以传输的数据为基础,采用CRC算法实现网络 数据的计算,然后依据分组存储的方式将数据进行存储,最后利用分层逆序叠加定位法对网络数据进行高精度查询,由此完成对网络大 数据的研究;实验结果表明,所提方法可以全面具体地对网络大数据进行研究,提高了数据处理精度和网络数据计算速度,增加了网络 数据存储空间容量和查询效率,减少了网络数据运行时的丢失率,扩展了网络数据的运作范围,为后续网络大数据的研究提供了强有力 的依据。 关键词:云计算;物联网;网络大数据;技术研究 Network Big Data Technology Research Based on Cloud Computing and Internet of Things Jiang Diqing,Zhang Lina (Department of Information Engineering,Zhejiang Security Career Technical College,Wenzhou 325000,China) Abstract:In order to make the network data applications broader,more to improve the precision of the network data storage and man— agement,reduce the time of the network data processing and control,need to study of network data.The current network data research method is to adopt more major Hadoop infrastructure of network data,the data is stored in the safe storage index is set,do not have access to data security storage index weight and the low data storage security performance,network problems such as big data research accuracy de— viation.For this,put forward a kind of big data based on cloud computing and Internet of things network research methods.This method firstly using hierarchical network coding for network data transmission,based on the transmission of data,the calculation of CRC algorithm was adopted to realize network data,and then based on the data packet storage way for storage,the hierarchical reverse superposition method is used to analyse the network data precision query,thus completing the study of network data.The experimental results show that the pro— posed method can comprehensively and concretely study of network data,improves the precision of data processing and network data compu— ting speed,increased the network data storage capacity and query efficiency,reduces the network data presented.according to the runtime, expanded the scope of the operation of network data,large data for subsequent network research provides a strong basis. Keywords:cloud computing;internet of things;network data;technology research O 引言 目前,随着经济技术和互联网的不断发展,人们步入了信 络大数据进行研究。大多数的网络大数据研究方法在对网络大 数据进行研究时,无法对其进行高效、全面、安全、具体地研 究,导致网络大数据在使用时,经常出现数据丢失、数据计算 息化时代,计算机网络已经成为人们生活和工作中不可缺少的 一部分。网络大数据在金融、娱乐、医疗、汽车、零售、电 误差大、数据存储空间易满、数据处理不妥当等问题 ]。在 此种情况下,如何减少数据丢失率和计算误差,增大数据存储 空间容量和提高数据处理精度成为了必须解决的问题。而基于 云计算和物联网的网络大数据研究方法可以对网络大数据进行 深刻,全面,安全稳定地研究,是解决上述问题的可行途 径 ],受到了该领域专家学者的广泛关注和高度重视,成为了 网络大数据研究者的主要研究课题,同时也得到了很多优秀的 研究方法 。 信、餐饮、政务、能源、体育等领域都有着广泛的应用和深远 地影响 ]。由此,网络大数据的发展受到了有关专家的高度重 视E2]。网络大数据的发展可以提高现代人们生活的质量,加强 互联网技术的建设,满足社会经济飞速发展的要求。。]。由于网 络大数据具有智能性、交互性、可视化等特点,所以需要对网 收稿日期:2017—04—17;修回日期:2017—05—15。 文献[8]提出了基于MongoDB的网络大数据研究方法。 该方法首先利用负载均衡技术使MongoDB在不同的网络数据 节点中都可以分布均匀,保障大数据研究系统的正常运行,然 后采用P2P分布式数据存储系统对网络大数据的存储内存空 间进行优化管理,最后依据MongoDB的自动分片技术实现网 络大数据的过滤,从而完成基于MongoDB的网络大数据研 究。该方法虽然较为具体,但是存在对网络大数据研究时间长 基金项目:浙江省教育厅一般科研项目(Y201635414);浙江省高教 课改项目(KG20161013);温州市公益性科技计划项目(2016S0005)。 作者简介:姜迪清(1965一),男,浙江温州人,硕士,主要从事舆情管 理等方向的研究。 通讯作者:张丽娜(1980一),女,河南安阳人,硕士,副教授,主要从 事大数据,图形图像等方向的研究。 ・184・ 计算机测量与控制 p一(6m4-5)(口/ +z) 第25卷 (3) 的问题。文献[9]提出了一种基于粗糙集的网络大数据研究 方法。该方法首先采用粗糙集理论对网络大数据进行挖掘,然 后利用模糊集理论拓广网络大数据处理的范围,依据粗糙集与 决策表的关系完成对网络数据的处理,最后利用模糊差别矩阵 对数据进行优化存储,由此完成了基于粗糙集的网络大数据研 究。该方法对网络大数据的研究精度较高,但是存在研究过程 繁琐的问题。文献Elo]提出了一种基于朴素贝叶斯的网络大 其中: 代表网络大数据传输延迟估计值,ITt代表网络数 据有限域的阶, 代表网络大数据传输参数。对于不具确定性 的网络数据编码,网络大数据传输延迟值估计公式为: 一(6m4-5)[(1/z+1/z)+z4-8z /(6£)]+ (2m+m ) /(4Z) (4) 其中:z代表网络数据块长度。实验证明,网络数据传输 延迟值随m的增加而增加,利用数据传输参数d可以有效控 制m的增加,使数据传输更为迅速,其公式可表示为: 数据研究方法。该方法首先利用朴素贝叶斯分类器将网络大数 据进行分类,然后依据数据分类结果对网络数据进行存储,最 后采用本体论实现网络大数据控制系统的优化,完成基于朴素 贝叶斯的网络大数据研究。该方法虽然用时较短,但是存在对 网络大数据进行研究时,研究效率较低的问题。 针对上述产生的问题,提出基于云计算和物联网的网络大 d=>:P*{ l,“2,“3…地} (5) 根据式(5)的计算,可以减少网络数据节点编码进行数 据传输时的延迟,低阶的数据有限域能减少数据传输对编码节 点的要求。当 > ,假设网络数据节点P有比较足够的数据 存储空间,则可以利用数据存储转发的方式进行网络数据传 输,当 <z 时,在网络数据节点P处插播附加数据信息, 利用网络宽带容量对网络数据进行传输,从而完成网络数据的 传输。 数据研究方法。该方法首先利用分级网络编码对网络数据进行 传输,采用CRC算法实现网络数据的快速计算,然后依据分 组存储的方式将数据存储,最后利用分层逆序叠加定位法对网 络数据进行高精度查询,由此完成对网络大数据的研究。仿真 实验证明,所提方法能够全面、安全、高精度地对网络大数据 进行研究,拓宽了网络统计的范畴,增强了网络数据分析的可 信度,将无线网络与人们的生活进行无缝连接,并且可以更好 在网络大数据研究中,网络数据的计算十分重要,为了使 网络数据计算速度更快,采用按字节计算的CRC算法对网络 数据进行计算。网络数据码可表示为: O(X)一Oo×4“+ —l×4 ‘一 ’+…+Ol×4 +Ob(6) 地应用于社会各个工作领域中,为社会的经济建设和健康发展 提供了可靠资源。 1基于云计算和物联网的网络大数据研究方法 1.1网络数据传输与计算 其中:O(X)代表网络数据编码,0代表一个数据的八位字 节,,z代表八位字节的个数。以上述计算结果为基础,将数据 字节先乘216,再除数据计算多项式F(X),给出关系式: 基于云计算和物联网的网络大数据研究中,为了提高数据 运行效率,利用分级网络编码对网络数据进行传输,在数据传 Q F(X) 一 F( ) …X×2 +  F(X) …×2  ×z+ +…+ 。 ㈩ 输过程中,以网络数据宿点集合为基础,得到网络数据传输延 迟值估计公式,依据估计公式中网络数据有限域的阶的变动得 到数据传输参数,完成多网络数据传输的过程。具体过程 如下。 通过关系式(7)可知,在网络数据计算过程中,关系式 所获值越小,网络数据计算速度越快,则有控制关系式最小的 阈值表达式为: 在实际网络大数据传输过程中,网络数据通常具有分级结 构,假设在网络数据节点P处,将收到的网络数据进行解码 后,再组播到子网中,而在其他的网络数据节点处,则利用编 码形式进行数据传输,并让所有网络数据宿点在收到数据信息 进行解码后,对分级网络数据编码方法的最大组播率进行假 ,一£ ×g (8) 其中:厂代表控制关系式(7)最小值的阈值,W代表网络 数据传输的系数,g代表网络数据计算参数,综上所述,通过 阈值对关系式的控制,实现了网络数据的快速计算。 1.2网络数据存储与查询 设,假设最大组播率为“,则网络中所有宿点集合可表示为: T={“l,“2,“3…“ ) (1) 其中:T代表网络中所有数据宿点的集合,i代表分级网络 数据编码方法中组播率总数目。 若,{ ,“ ,地…啦)代表主网的网络数据宿点,{“ ,U一, 采用分组存储的方式对网络数据进行存储,可以节省网络 存储空间。存储过程中利用网络数据测点和分组存储组数的关 系式,得到分组后的网络文件数据总量,以分组后的网络文件 数据量总和为依据,完成对网络数据的存储。 假设共有J个网络数据测点,每个网络数据测点采样周期 不一定相同,若每个数据测点大批量提交存储,其属性数据有 r个,那么就将这些数据进行分组存储至不同的网络文件中。 根据数据距离的远近,将较为集中的网络数据测点分为一组, …“一}代表子网的网络数据宿点,网络数据节点P代表子网 和主网的连接点,如果采用分级网络数据编码对其进行连接, 就相当于两次单源组播对其进行连接,在连接过程中,如果将 数据源点A组播网络数据到{“ ,“。,“。…娥,P}中,那么其网 络数据最大组播率为 ,如果将网络数据节点P的组播数据到 {“ ,“抖。,…“ }中,那么其网络数据组播率为 利用分级 假设将 个数据测点分为e组,则有数据测点与组数的关 系式: 网络数据编码从网络数据源点组播数据到所有网络数据宿点, 可以得到的最大的网络数据组播率为zz,则有关系式: 2=rain(z, 1) (2) ∑r 络属性数据,则文件Y 的数据总量为: D 一(6+M)J (9) 利用分组后的网络文件Y 保存第e组数据测点提交的网 (10) 以上述结果为依据,对于确定性的网络数据编码,网络大 数据传输延迟值估计公式为: 第11期 姜迪清,等:基于云计算和物联网的网络大数据技术研究 ・ 185 ・ 其中:D 代表分组后的网络文件数据总量,M代表网络数 据存储参数,实验证明,M取值区间在0.4—0.5时,数据存 储效率最高。 网络大数据研究方法,具有良好的应用价值,是切实可行的。 表2是网络数据存储参数M的取值对数据存储效率(%)的 影响。 表1不同方法下网络数据传输与计算时间对比 对式(10)进行迭代计算,最后得到e个分组后的网络文 件数据量总和为: D一 Di一(6+M) jl (11) f一1 i一1 其中:D代表e个分组后的网络文件数据量总和,以分组 后的网络文件数据量总和为依据,完成基于分组存储方式的网 络数据存储。 网络数据的查询与索引利用的是分层逆序叠加定位法,假 设数据查询节点的主查询矩阵Q与辅数据查询矩阵Q一相乘 得到新数据查询矩阵,提取数据最大查询矩阵公因子与该矩阵 相加为: n n Q 1 = +QQ 1 (12) E 1 其中:e 代表QQ 一 所得数据查询矩阵的最大公因子, Q 一 代表网络数据最大查询矩阵公因子与该矩阵相加的值, QQ 代表数据查询节点的主查询矩阵Q与辅数据查询矩阵 Q 相乘得到的新矩阵,同理可证,式(13)和式(14)中的 类似乘积如式(12)参数解释所推。 ^ ,n Ql一2 一 — =呈+Q 1 Q 2 (13) E 一2 其中: 一 代表Q一 Q一 所得数据查询矩阵的最大公因子。 以此类推,直至数据根节点: n n, Q 一 +Ql Q2 (14) E1 其中:e 代表Q Q2 所得数据查询矩阵的最大公因子。提取 数据查询矩阵Q 最大公因子e,则: £一£1+1 (15) 此时得到e值,假设该值代表数据查询节点在整个网络数 据查询系统中的查询参数,实验证明,此参数取值区间为5— 6时,网络数据查询精度最大。那么对s进行迭代计算,并比 较各个数据查询节点的e值,取得最小数据查询节点,则该节 点在整个网络数据查询系统中是数据查询的最优路径点,此时 忽略其他数据查询节点,在数据查询系统中,针对该节点进行 查询,从而完成对网络数据的查询。 2仿真实验结果与分析 为了证明基于云计算和物联网的网络大数据研究方法的整 体性能,需要进行一次仿真实验。在FPGA的环境下搭建网 络大数据研究实验仿真平台。实验数据取自于中国网络大数据 技术研究公司的5O台计算机,在该实验中,利用基于云计算 和物联网的网络大数据在5O台计算机中使用,观察本文所提 方法的整体有效性和可实现性。表1为文献E8]所提方法、 文献E9]所提方法和文献[10]所提方法与本文所提方法, 在数据量同为1 000万时,网络数据传输时间(s)以及网络 数据计算时间(s)的对比。 分析表1可知,在网络数据量同为1 000万时,本文所提 基于云计算和物联网的网络大数据研究方法,数据传输时间以 及数据计算时间远低于文献所提方法。本文所提方法在数据传 输和数据计算中分别利用了分级网络编码和CRC算法,节省 了数据传输和数据计算的时间,证明了基于云计算和物联网的 网络大数据研究方法 数据传输时f'q ̄/s 数据计算时IE/s MongoDB 20 15 粗糙集 15 12 朴素贝叶斯 30 20 云计算和物联网 8 6 表2数据存储参数对存储效率的影响 存储参数M取值 数据存储效率( ) 0.2 78.9 0.3 80.1 0.4 97.8 0.5 98.6 0.6 85.3 通过表2可知,网络数据存储参数M的取值对数据存储 效率有很大影响,存储参数取值在0.4~0.5时,网络数据存 储效率最高,这主要是因为在利用本文方法进行网络数据存储 时,采用了分组存储的方式对网络数据进行存储,不仅可以节 省网络存储空间,而且可以加快数据存储速度,存储过程中依 据网络数据测点和分组存储组数的关系式,得到分组后的网络 文件数据总量,在数据总量中存储参数M值的变化,影响着 数据存储效率。图1是文献[8]所提方法、文献[9]所提方 法和文献Eao]所提方法与本文所提方法,网络数据查询时间 (s)的对比。 10 8 匠 翟 6 窟 {姐 骧 4 巅 2 0 0 100 200 300 400 500 数据查询量/万个 图1不同方法下数据查询时间对比 图1中反映的是,文献[8]、文献E9]和文献[10]所 提方法与本文所提方法在数据查询时间上的对比,也是速度的 对比,随着网络数据查询量的不断增加,所用时间也在不断发 生变化,文献[8]所提方法数据存储时间波动虽然较小,但 是处于曲线一直处于较高的趋势,是所有方法中数据存储时间 最长的;文献[9]所提方法虽然数据存储用时相对文献[8] 较少,但是数据查询时间曲线后期波动很大,显然是不可取 的;文献ElO]所提方法在数据查询量比较小时,查询时间是 降低趋势的,但是随着数据查询量的增加,数据存储时间呈直 线上升趋势;文本所提方法在前期存储数据所用时间曲线略有 波动,但总体情况良好,进一步证明了本文所提方法的可实践 (下转第189页) 第11期 郭 敏.等:基于FI ( A的多通道串f]数据采集_Ljf々输没汁 ・ l8【) ・ 过列彩路 f I数据的¨fI1『采集、缓冲及于『包的数批流处理思 想,果川Ff A( +多Ⅲ[『l USB的硬件框架及多种总线小问 速率的传输算法。贸观J 多路串口数 的采集 传输 沧丈仪 从原 J 进行有效的验证.存产品的后期l殳计中, l『从小型 化、 能化打向出发.选择高集成俊、扣能 芯片.实现采集 传输摸块的即插即拔。 图9 多接 1缓存数据结构 参考文献: [1]邓鳆杰.多路串【j到以太I删的数据阀是的没il‘与实现 D].昆 对象.泼 台具有USB接门、Xilinx公州的可编程逻辑芯 HJj:云南大学.2011. Spartan6 XC6SI Xl5O、40针可编程1()接¨.符台多串【]数 据采集最小系统要求。其中,以6pins/6pins作为目标申u的 输入/ 输出接[],6pins/6pins作为源串【】的输入/输 接Lj, 通过Ft (;A内部设定的状态饥实现数 的传输:而上他fJ【以 sl e~FIF()传输模式.经USB2.0接L_】汝取FP( A f々求数 据.经数据包的识别、解包,最终还原…符个f}j口的数 ,最 终对发送的源数据和接收的日标数据进行比对。 通过1()O次模拟实验。缚次实验传输65535个字符数蛾. 通过比较发现源数据与接收数据一致.无ffI现误比特的脱象. [23贸佩衡.串口 以太嗍关转换器设计及其在通信供电监控系统巾 的应用[r)].长春:f譬林大学.2(7)1 1. [3]李志伟.姚汀敏.壤{:串口通信的控制系统没计[J].科技与创 新.201 6(1(;):l【)!一1O3. [4]陈标尼.』三保成等.牲r FI’( A和FIF()技术的多串rJ系统设汁 j实现『J].汁算机测试 控制.2O1 3.21(1f)):2835—2837. [5]康春f村.几种常¨j』1:荚防抖电路简介[J].电子IIt ̄界.:()O9 (I1): 】3—4 4. I 6]戴钱坤. ・种新型fJl蛾防浪涌电压保护,电路没jI[J .电f技术 应用.21)l1(¨):58—60. 这结果表叫该方案是有效的.试验满足预期要求.达到多路}{j 口同时采集及传输的目的.由此验证r模型的正确性。 [7]li兵兵.基于EZ USP,FX2和FP( A的数据传输系统研究[D]. 阿 炙:阿安电子利.技大 :.2O1(). 4 结论 论文坫于FPGA的多通道串口数据采集 j传输设计.通 9 曲 孙。 ’ 聃 蚋 9 蚋 " i , i9 神 时 [8]张 静.叶小芹。接r F【)GA的高速USB协议分析仪的没汁 lJ}.绥化学院学报.!(11 6(9):l 52—1 {. . j j 拍 j i 扣. i . i (上接第l 85页) 性。图2是网络数据查询系统中的查询参数e,对数据 询精 丢包牢过火、 络数Ⅲ运行仃延迟、『斓络辱命越来越矩等问 题。提f{ -种基于云汁 :f1I物联网的网络夫数据研究厅法..并 度( )的影响。 l00 通过实验叫,所捉 ’法可以商精度地对『矧络人数槲进行 研究.是具有¨】J仃 珀0,为该领域的 续研究发展提供_r有效 依据.足值得借掺的f叫络人数据研究力‘法。 参考文献: 80 芝 冀60 露 [1]基于大数据的互联刚化 量经营”项¨组.运营商存 经营丈数 据平台及其关键技术研究r J].电信科学.2o11.3o L 6):118 —耋40 籁 1 25. [2 任 凯.邛 武.俞 琰.基于大数据技术的网络日志分析系统 研究[J].现代电 技术.201 6,39(2):39—41. [3]张科利,王建文.髀 豪.互联网 煤矿开采大数据技术研究与 实践[J].煤炭科学技术.201 6. 4(7):12:;一1 28. E4]周胜利.陈光宣.哭礼发.大数据隐私保护中基于可信邻居选择 分析图2町知,当数据查询参数e为7时,数据查证IJ精度 曲线不稳定,而且查询精度较低.基本在6O 以内, 数据 的用户网络行为匿名技术研究[¨.计葬机科学.20l6.43 (1 2):136—1 39. 杏询参数e为5~6时.数据台询精度曲线卡f】刈’平缓. 湖精 [5]叶勇蒙.许 燕,朱一杰,等.网民对“人祸”事件的道德情绪 特点 基于微博人数据研究[J1.心理学报,2016。48(3 : 度较高,并且两度处于同一精度值,说明r本文所提基于云汁 算和物联网的网络大数据研究方法.可以为该领域的研究发展 2 L)1)一3()4. [6]鞠洪艳.大数据网络HR务器群智能伸缩机制与架构研究rJ],电 信科学.201 5.31(: ):89—97. 提供强有力的依据。 实验结果表明.所提方法可以高效、安全地对网络人数撕 进行研究,提高_r网络数据传输与数据计算的准确率干¨稳定 性,减少了网络数据运行的时间,增加r网络的使用寿命以及 兼容性.扩展了网络大数据的应用范围。 [7]崔新会.陈 刚,何 强.大数据环境F云数据的访川控制技术 研究[J].现代电 技术.201 6,39(15):67—69. [8]沈 琦.陈 博.毖于大数据处理的 TI 框架的研究与设汁[J]. 电子没汁l 程.2()1 6.21(2):25—27. 3 结束语 采刖当l{i『方法对网络大数据进行研究时.无法对网络大数 据进行高精度、安全、稳定可靠地研究.存在网络数据操作时 [9]曾润喜.王琳,ff:洪涛.基f知识管理视角的大数据研究『矧络 j结构研究[J].情报学报.201 6,35(1】):11 73—11 84. [1O]刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报:工 学敝.20l1.t8(6):957—972. 

因篇幅问题不能全部显示,请点此查看更多更全内容