多大的数据,才能称为大数据呢?

作者&投稿:姬岩 (若有异议请与网页底部的电邮联系)
多大的数据量称得上大数据~

大数据的数据量巨大。以数据量大、类型多、存取速度快、应用价值高为主要特征的数据集合。

为了应对大数据挑战,已形成对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。

其实首先你要区分大数据和大数据量的概念。大数据量只是一个纯粹的数据量级的问题,而现在大家所谈论的大数据主要包括搜索、新闻、博客、微博等社交网、移动电话和短信、热线电话和监控数据、通测数据等等。这些数据大多数为我们日常社交生活或是语音通信时产生。通常为TB级别,非结构化数据。而TB级别的数据用excel或者其他数据分析工具是很难展现处理的,这时就需要BI工具来应对大数据。FineBI针对大数据有专门的大数据量解决方案,可以去它的官网看看,就不附链接了

多大容量的数据才算大数据,其实并没有定论,所谓的大数据的规模压根没有具体的标准,而仅仅规模大也不能算做是大数据。但另一方面,我们需要注意的是,目前的数据确实在不断的变大,据国际公司IBM研究,截止到2020年,全世界的数据规模将达到今天数据量的几十倍,而今天的数据也早已只能用ZB这样庞大的计算单位来进行统计了。

那么,既然大数据并不是用大容量来衡量的,那究竟什么是大数据呢?

这就不得不引用之前提到的IBM公司了,他们自己对于大数据有一套著名的5V理论:Volume(大量)、Velocity(高速)、Variety(多样性)、Value(价值)以及Veracity(真实性)。

1.Volume(大量)

刚才也说道,大数据并不是用大容量来衡量的,但大数据一定代表着这个数据具有一定的量级了,以至于在一台机器上并不能处理,必须借助分布式运算的方式来进行操作。

2. Velocity(高速)

ZB级别的数据带来的并不仅仅是数据储存方面的问题,更代表着数据处理的速度必须到达一定的界值,不然我们很难有秒级的千人千面的广告推送。

3. Variety(多样性)

当下如此爆发性增长的数据其实更多的是非结构化数据,而这种数据是与我们传统印象中Excel储存的二维表是不同的。非结构化数据更多的是以声音、图像、地理位置、视频等形式存在。而这样的数据,则代表着更高的数据处理要求。

4. Value(价值)

大数据就是高价值的代名词么?并不是,反而大数据代表着价值密度更低的数据。用一个成语来形容如今的数据分析或者数据挖掘,那就是大浪淘金。而究竟如何在一个大数据中提取有价值的信息呢,不得不说,这是一个机遇也是一个挑战。

5. Veracity(真实性)

大数据就一定真实么?并没有。为什么这么说呢,想象一下当下泛滥的作弊流量吧,你还敢确保你的用户数据并没有虚假的吗?所以,大数据也是可以造假的,我们一定要有一双智慧的眼睛却辨别大数据的好坏。



    有人说拥有了数据,就仿佛拥有了全世界,数据所带来的是人类远远想不到的,随着时代的发现,大数据的新兴发展,给世界带来无限的可能,对于大数据,数据的含量是巨大的。对于大数据,没有明确的大小规定,大数据量和大数据是完全不同的两个概念,如果数据仅仅是规模大,这也不能称作大数据。大数据应该说是大计算再加数据量。

    单从数据量的角度来说,数据单位量达到PB、TB等,数据就会被称为大数据。这个单位所包含的数据量是非常巨大的。有人说,1PB所面对的数据,如果仅仅向磁盘写入1PB的数据就要耗费200多天,并且全人类的总资产加起来也不到1P美元,还有以TB单位的数据相当于全世界沙滩全部的沙子量,大小永远是相对的,更多的是运用数据,发现数据背后的价值,这是要经过精心的分析才会被开发出来。

     规模也是要靠不同的维度去衡量,从时间序列累积大量的数据,还有在深度上更加细化的数据。例如再小的数据,纵向积累时间长了,也可以累计成大的数据,横向积累也可以与其他数据关联起来也可能形成大数据,因此大数据中的数据都是彼此关联,具有价值的。

  对于大数据,其中“大”是必要条件,但非充分条件,有了数据也不会处理挖掘,也没用,大数据的核心价值在于开发运用,有了大数据的支撑才有智能的出现。



企业端(B端)数据近十万的级别,就可以称为大数据;
个人端(C端)的大数据要达到千万级别。
收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据。
截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。


大数据究竟多大才算是,该如何学习大数据?
大数据本身是基于数据价值化而构建出来的新概念,虽然概念比较新,但是数据却一直都在,所以大数据的核心并不在“大”上,而是基于大数据所构建出的一个新的价值空间。 在理解大数据概念的时候,通常都有几个较为明显的误区,其一是只有足够大的数据才能算是大数据范畴;其二是大数据和互联网是隔离的;其三是大数据就是统计...

多大的数据,才能称为大数据呢?
1.Volume(大量)刚才也说道,大数据并不是用大容量来衡量的,但大数据一定代表着这个数据具有一定的量级了,以至于在一台机器上并不能处理,必须借助分布式运算的方式来进行操作。2. Velocity(高速)ZB级别的数据带来的并不仅仅是数据储存方面的问题,更代表着数据处理的速度必须到达一定的界值,不然我们...

什么样的数据可以称为大数据?
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言...

大数据是什么?
"大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理...

大数据的定义是什么?
大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、...

大数据是什么?多大的数据叫大数据?
根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。企业端(B端)数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。很有趣,大家可以看到2B和2C,两类...

简述什么是大数据
洞察发现力和流程优化能力的海量、高增差率和多样化的信息资产。大数据的主要特点就是数据量大、数据处理速度快、数据真实性高、数据类别复杂等,它们合起来被称为4大数据也可以应用在警察预测犯罪的发生、预测选举结果,同时还能通过手机定位数据和交通数据建立城市规划,现在医疗行业也在做大数据的分析。

多大的数据才算“大数据”
——Gartner (2)海量数据量、快速数据流和动态数据速度、多样的数据类型和巨大的数据价值。—— IDC (3)或者是海量数据、海量数据、大数据,是指所涉及的数据太大,无法在合理的时间内被截取、管理、处理、整理成人类可以解读的信息。—— Wiki 大数据的其他定义也差不多,可以用几个关键词来定义大数...

什么是大数据,它有哪些特点
大数据技术是指从各种各样海量类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。大数据具备以下4个特点:一是数据量巨大。例如,人类生产的所有印刷材料的数据量仅为200...

什么是“大数据”,如何理解“大数据”
你好,大数据是指巨量的数据,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。当下,大数据技术作为新兴技术被许多互联网大厂所需,以华为为例。1、华为云推出大数据稽核方案解决偷逃费 很多朋友可能发现,部分省界收费站变少而ETC通道在增加,高速公路...

于洪区15977819219: 多"大"才算大数据 -
壬农舒亚: 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产.这是百度百科的解释.简单点说,大数据就是字面上的意思,它所涵盖的信息是海量的,它跟一般的数据不同,它带来的信息是多维度的,就连常规的数据处理模式都无法处理它.

于洪区15977819219: 想要了解什么是大数据吗 -
壬农舒亚: "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理. "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中...

于洪区15977819219: big ideas:how big is big data?大数据思维:要多大才算是大数据 -
壬农舒亚: 首先,这是一个概念,并不是说一定要超过某个量tb,zb等才能算.其次,大数据一般是很多很不对称的数据构成,可能非常微小和琐碎,但组合起来后缺非常有价值.最后,通过专业技术分析,可以得出很多超预测的判断,这才是价值所在啊.望有帮助.

于洪区15977819219: 大数据有多大 -
壬农舒亚: 大数据应该只是一个概念,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合.http://product.dangdang.com/25093277.html

于洪区15977819219: 什么样的数据量叫大数据? -
壬农舒亚: 很多行业都需要大数据技术方面的支持,但是现在的交换机等产品不一定能支持软件的进步,又是一个更新换代的时候,国内外很多网络产品厂商都有相关的支持产品.

于洪区15977819219: 如何准确又通俗易懂地解释大数据及其应用价值 -
壬农舒亚: 大数据说到底就是一个大字.到底有多大?拿维基百科上的例子来说,CERN做的LHC(大型强子对撞机)周长27公里,里面一共有1.5亿个传感器,每秒钟读数达四千万次.每秒钟发生的粒子对撞高达6亿次.剔除99.999%的无用数据,每秒钟...

于洪区15977819219: 行业观点:数据到底多大才算大数据 -
壬农舒亚: 不是这么个说法,表面意思大数据是很多的数据,但是大数据是一门技术.—柠檬学院大数据.

于洪区15977819219: 什么叫大数据 -
壬农舒亚: 大数据包含几个方面的内涵吧1. 数据量大,TB,PB,乃至EB等数据量的数据需要分析处理.2. 要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大...

于洪区15977819219: 现在大数据这么火,怎么理解数据服务?有用吗? -
壬农舒亚: 数据服务简单来讲应是一种商业化智能协同网络,洞察挖掘数据价值,常应用于品牌洞察、商业地产、金融风控、App投研、营销等行业领域或商业行为中.以全球领先的数据智能科技平台MobTech为例,其自有的大数据资源库+算法能力,使...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网