作者:好人langren_840 | 来源:互联网 | 2023-05-19 07:12
大数据,这个词早已不知不觉地融入了我们的生活中。今天听了大数据讲座后,我对它的认识又上了一层台阶。
何谓大数据?顾名思义,大数据就是庞大的数据。 用IT行业术语来讲就是“巨量资料”。在人类活动空间愈来愈小的时代,数据却愈来愈大。没错,每个时期的数据对其当时的科技界来讲都是“大数据”。譬如,某饭店为扩展市场,便统计了全球各地的人们早餐类型。如此一来,又一个“大数据”诞生了。全球各地人们的早餐情况多不多?多,这数据大不大?大。
大数据有什么用?大数据的用途有很多。就拿上段的饭店来讲,即使统计人们的早餐情况的工作枯燥而繁琐,但当他得到这个数据之后加以分析,那么价值就来了——制作适合更多人的早餐,开辟更大的市场空间——目的达到。这只是大数据的经济价值。相对于人类社会来说,大数据的统计和分析还有更多的用途,譬如统计世界各地的犯罪率加以预测和防范便能推动治安工作的顺利开展。统计全球各地人们的基因序列有助于推动基因工程的发展。当然,大数据还有很多用途。大到探测宇宙,小到购物网站广告投放等等都是大数据的应用。我认为,在科学技术飞速发展的今天,拥有数据者比别人更有优势。
怎样统计大数据?这是一个令人深思的问题。对于众多微小企业而言,要统计数量庞大的数据是一件艰辛的事。但对譬如谷歌、IBM这类巨头而言,统计大数据并没有什么困难,因为早在很久以前,他们便已开始数据统计工作,譬如谷歌搜索。但我认为,众多微小企业可以采取踩台阶的方法进行数据收集,在扩展自己的业务的同时不断收集数据,另外也可探索同譬如百度等 大型公司进行数据的分享交换。
另,提出一些个人问题。
1,大数据时代的来临是否已表示在信息时代人们的信息安全已形同虚设?这是否与法律和道德相冲突?
2,今天博士提到一个问题就是有时会出现一种奇怪的现象,即对于数据统计结果而言,分开看很好,但一旦将统计结果结合在一起便出现如辛普森悖论(当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。--wikipedia)所描叙的情况。为何?这与我国“物极必反”非常相似。
3,博士讲话中表示,在大数据的前提下,个体数据的准确性不再重要。对此我认为,如果不能保证个体数据的准确性,那么大数据的准确性又从何而来呢?
4,大数据一个特点是大,我认为还有个特点就是---慢。对于微小企业或者有意向的个人团体而言,统计大数据是否会造成严重的经济困难,又或者说,大数据自统计到分析再到应用的时期会不会成本过高周期太长?
5,比较荒谬的想法,我们知道IBM的Watson超级计算机已经可谓是当代人工智能研究的代表产品。那么,是否可以让人工智能产品自动统计数据并加工呢?
6,为什么简单算法应用在大数据上有时会比复杂精确的算法更有效?
个人鄙见,望有识之士愿指点一二。
{topiniu,2014/12/13}