何為大數(shù)據(jù)?為什么大數(shù)據(jù)如此受關(guān)注
來(lái)源:新能源網(wǎng)
時(shí)間:2024-08-17 12:55:08
熱度:
何為大數(shù)據(jù)?為什么大數(shù)據(jù)如此受關(guān)注【專(zhuān)家解說(shuō)】:定義大數(shù)據(jù)與云計(jì)算的關(guān)系對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有
【專(zhuān)家解說(shuō)】:定義
大數(shù)據(jù)與云計(jì)算的關(guān)系
對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類(lèi)型和價(jià)值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)。
隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注?!吨婆_(tái)》的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過(guò)時(shí)間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展的存儲(chǔ)系統(tǒng)。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
它們按照進(jìn)率1024(2的十次方)來(lái)計(jì)算:
1 Byte =8 bit
1 KB = 1,024 Bytes = 8192 bit
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB
1 DB = 1,024 NB = 1,048,576 BB
全稱(chēng):
1 Bit(比特) =Binary Digit
8 Bits = 1 Byte(字節(jié))
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
特征
容量(Volume):數(shù)據(jù)的大小決定所考慮的數(shù)據(jù)的價(jià)值的和潛在的信息;
種類(lèi)(Variety):數(shù)據(jù)類(lèi)型的多樣性;
速度(Velocity):指獲得數(shù)據(jù)的速度;
可變性(Variability):妨礙了處理和有效地管理數(shù)據(jù)的過(guò)程。
真實(shí)性(Veracity):數(shù)據(jù)的質(zhì)量
復(fù)雜性(Complexity):數(shù)據(jù)量巨大,來(lái)源多渠道
意義
現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì),科技發(fā)達(dá),信息流通,人們之間的交流越來(lái)越密切,生活也越來(lái)越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物。阿里巴巴創(chuàng)辦人馬云來(lái)臺(tái)演講中就提到,未來(lái)的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代,DT就是Data Technology數(shù)據(jù)科技,顯示大數(shù)據(jù)對(duì)于阿里巴巴集團(tuán)來(lái)說(shuō)舉足輕重。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無(wú)煙煤、肥煤、貧煤等分類(lèi),而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類(lèi)似,大數(shù)據(jù)并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數(shù)量更為重要。對(duì)于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據(jù)是成為贏得競(jìng)爭(zhēng)的關(guān)鍵。
大數(shù)據(jù)的價(jià)值體現(xiàn)在以下幾個(gè)方面:1)對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)可以利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營(yíng)銷(xiāo);2) 做小而美模式的中長(zhǎng)尾企業(yè)可以利用大數(shù)據(jù)做服務(wù)轉(zhuǎn)型;3) 面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)需要與時(shí)俱進(jìn)充分利用大數(shù)據(jù)的價(jià)值。
不過(guò),“大數(shù)據(jù)”在經(jīng)濟(jì)發(fā)展中的巨大意義并不代表其能取代一切對(duì)于社會(huì)問(wèn)題的理性思考,科學(xué)發(fā)展的邏輯不能被湮沒(méi)在海量數(shù)據(jù)中。著名經(jīng)濟(jì)學(xué)家路德維?!ゑT·米塞斯曾提醒過(guò):“就今日言,有很多人忙碌于資料之無(wú)益累積,以致對(duì)問(wèn)題之說(shuō)明與解決,喪失了其對(duì)特殊的經(jīng)濟(jì)意義的了解?!边@確實(shí)是需要警惕的。
大數(shù)據(jù)與云計(jì)算的關(guān)系
對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類(lèi)型和價(jià)值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)。
隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注?!吨婆_(tái)》的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過(guò)時(shí)間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展的存儲(chǔ)系統(tǒng)。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
它們按照進(jìn)率1024(2的十次方)來(lái)計(jì)算:
1 Byte =8 bit
1 KB = 1,024 Bytes = 8192 bit
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB
1 DB = 1,024 NB = 1,048,576 BB
全稱(chēng):
1 Bit(比特) =Binary Digit
8 Bits = 1 Byte(字節(jié))
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
特征
容量(Volume):數(shù)據(jù)的大小決定所考慮的數(shù)據(jù)的價(jià)值的和潛在的信息;
種類(lèi)(Variety):數(shù)據(jù)類(lèi)型的多樣性;
速度(Velocity):指獲得數(shù)據(jù)的速度;
可變性(Variability):妨礙了處理和有效地管理數(shù)據(jù)的過(guò)程。
真實(shí)性(Veracity):數(shù)據(jù)的質(zhì)量
復(fù)雜性(Complexity):數(shù)據(jù)量巨大,來(lái)源多渠道
意義
現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì),科技發(fā)達(dá),信息流通,人們之間的交流越來(lái)越密切,生活也越來(lái)越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物。阿里巴巴創(chuàng)辦人馬云來(lái)臺(tái)演講中就提到,未來(lái)的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代,DT就是Data Technology數(shù)據(jù)科技,顯示大數(shù)據(jù)對(duì)于阿里巴巴集團(tuán)來(lái)說(shuō)舉足輕重。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無(wú)煙煤、肥煤、貧煤等分類(lèi),而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類(lèi)似,大數(shù)據(jù)并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數(shù)量更為重要。對(duì)于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據(jù)是成為贏得競(jìng)爭(zhēng)的關(guān)鍵。
大數(shù)據(jù)的價(jià)值體現(xiàn)在以下幾個(gè)方面:1)對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)可以利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營(yíng)銷(xiāo);2) 做小而美模式的中長(zhǎng)尾企業(yè)可以利用大數(shù)據(jù)做服務(wù)轉(zhuǎn)型;3) 面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)需要與時(shí)俱進(jìn)充分利用大數(shù)據(jù)的價(jià)值。
不過(guò),“大數(shù)據(jù)”在經(jīng)濟(jì)發(fā)展中的巨大意義并不代表其能取代一切對(duì)于社會(huì)問(wèn)題的理性思考,科學(xué)發(fā)展的邏輯不能被湮沒(méi)在海量數(shù)據(jù)中。著名經(jīng)濟(jì)學(xué)家路德維?!ゑT·米塞斯曾提醒過(guò):“就今日言,有很多人忙碌于資料之無(wú)益累積,以致對(duì)問(wèn)題之說(shuō)明與解決,喪失了其對(duì)特殊的經(jīng)濟(jì)意義的了解?!边@確實(shí)是需要警惕的。
熱門(mén)標(biāo)簽:數(shù)據(jù) 透視
-
固定資產(chǎn)投資項(xiàng)目節(jié)能登記表中的“年需要實(shí)物量”的數(shù)據(jù)來(lái)源2024-08-17
-
在“節(jié)能減排,做環(huán)保小衛(wèi)士”活動(dòng)中,小明對(duì)兩種照明燈的使用情況進(jìn)行了調(diào)查,得出如表所示的數(shù)據(jù)2024-08-17
-
太陽(yáng)能電池板什么樣的好啊 最好給參數(shù)數(shù)據(jù) 淘寶買(mǎi)應(yīng)該注意哪些問(wèn)題 請(qǐng)有經(jīng)驗(yàn)的友友解難 急!!!2024-08-17
-
求一份節(jié)能減排的調(diào)查報(bào)告,400~500字,有調(diào)查方法和相關(guān)數(shù)據(jù)2024-08-17
-
中國(guó)能源分布比例數(shù)據(jù),在線(xiàn)等2024-08-17
-
請(qǐng)問(wèn)路寬十二米,兩側(cè)裝太陽(yáng)能路燈,六米的高度,大概隔多少米放置一個(gè)合適?數(shù)據(jù)越詳細(xì)越好2024-08-17
-
南昌市的能源消費(fèi)結(jié)構(gòu)數(shù)據(jù)要怎么找2024-08-17
-
高碳生活危害的直接統(tǒng)計(jì)數(shù)據(jù)2024-08-17
-
哪位能提供下讀取mdb數(shù)據(jù),存入mysql數(shù)據(jù)庫(kù)中的c、c++程序啊2024-08-17
-
argo浮標(biāo)數(shù)據(jù)怎么用matlab處理2024-08-17
-
速度求近年來(lái)我國(guó)太陽(yáng)能發(fā)展趨勢(shì)及具體數(shù)據(jù)?2024-08-17
-
太陽(yáng)能led路燈比普通路燈能節(jié)省多少錢(qián)?麻煩各位給出具體數(shù)據(jù)!謝了!2024-08-17
-
天然氣和液化石油氣中的碳元素的質(zhì)量分?jǐn)?shù)比約為78%和82.3%,通過(guò)數(shù)據(jù)表明天然氣做燃料比液化石汽油更環(huán)保2024-08-17
-
用電子轟擊原子核會(huì)發(fā)生什么反應(yīng),最好有試驗(yàn)數(shù)據(jù)。2024-08-17
-
煉鐵焦炭;反應(yīng)性(CRI);反應(yīng)后強(qiáng)度(CSR)的好壞如何判定,具體數(shù)據(jù)是多少2024-08-17