二、大数据的定义与特征:
(一)定义:
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
(二)特征:
大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性);在此基础上,专家学者们还总结出复杂性(Complexity)、可变性(Variability)。
1、大数据的类型多种多样(Variety)
经济在发展,时代在发展,人类社会中产生和存在的数据不仅在数量上越来越多,且在类型上也越来越呈现多样化。它不仅包括人与人之间的产生的数据种类,还包括机械与机械之间产生的数据类型,包括人与机械之间产生的数据类型等等。其涵盖的范围也相对较广,包括了视频图像等多种方式,多种多样的数据类型的产生无疑可以帮助我们的企业不断地发展壮大。
2、大数据的处理速度相对较快(Velocity)
大数据一直都有一秒定律,即指大数据在处理资料时速度相对较为快速一些,这主要是由数据流的高速性和实效性来决定的。对于大数据的信息,我们需要对其进行快速而有效的处理,并且一定要达到能够全面深入的挖掘有价值的信息的能力,这对于企业针对有关事项做出精准的判断和分析并拿出有效措施极为有利。
3、大数据的数量体量较为庞大(Volume)
有关数据显示,近年来,随着科学信息技术的快速发展,大数据的存储量一直保持在不断增长的状态,且仍有继续高速增长的发展趋势,它的快速发展直接推动了大数据的商业价值意义。
4、大数据的价值较高(Value)
数据的收集相对容易,通过程序收集、服务器储存,在采用特殊的技术,进行大数据分析,通过合理运用大数据,以低成本创造高价值。
5、大数据的真实性可以保证(Veracity)
大数据多来源于人们的实际行为,真实性较高,数据的质量值得相信。
6、大数据的比较复杂(Complexity)
数据量巨大,来源多渠道,如有需要,可以收集各类资料,来源复杂且不固定。
7、大数据的容易变动,不稳定(Variability)
大数据大多来源于网络上人们的行为,人们的行为不可能一直保持不变,存在随时变化的特点,妨碍了处理和有效地管理数据的过程。
三、大数据的发展现状与实际应用
大数据在企业中的应用研究(二)由毕业论文网(www.huoyuandh.com)会员上传。