首頁慕課(ke)課(ke)程(cheng)正文(wen)

五百彩票快三

  現如今,我們身邊很多人對一(yi)些熱門的新技術、新趨勢往往趨之若鶩卻(que)又很難說得透徹,比如大數據,如果(guo)被問(wen)大數據和你有(you)什麼(me)關(guan)系,估計很少能說出一(yi)二三來。究(jiu)其原因,一(yi)是(shi)因為大家對新技術有(you)著相同的原始渴shi)螅 遼僦 淙唬 諏奶焓輩換嵯xian)得mei)塴巴簾bie)”;二是(shi)在工作和生活環(huan)境(jing)中(zhong),真正能參(can)與實踐的大數據案例實在太少了,所以大家沒hui)謝嶧ㄊ奔淙? 淥勻弧/p>

  我希望有(you)xing)┌灰yi)樣,所以yuan)願萌綰he)去認識大數據進行(xing)了一(yi)番思索,包括(kuo)查閱了資料(liao),翻閱了最新的專業書(shu)籍(ji),但我並不想把那些零散的資料(liao)碎片(pian)或不同理解論述(shu)簡單規(gui)整並堆積起來形成毫無(wu)價值的轉述(shu)或評論,我很真誠的希望進入(ru)事物(wu)探尋本(ben)質(zhi)。

  如果(guo)你說大數據就是(shi)數據大,或者侃侃而談4個(ge)V,也許(xu)很有(you)深度的談到BI或預測的價值,又zhi)蛘唚oogle和Amazon舉(ju)例,技術流可能會聊起Hadoop和Cloud Computing,不huai)guan)對錯,只(zhi)是(shi)無(wu)法勾勒對大數據的整體認識,不說是(shi)片(pian)面,但至少有(you)xing)└guan)窺蠡測、隔衣瘙癢了。……也許(xu),“解構”是(shi)最好(hao)的方法。

  怎樣結構大數據?

  首先,我認為大數據就是(shi)互聯網發展到現今階段的一(yi)種表象或特征而已,沒hui)斜匾 窕八蚨運3志(zhi)次分(fen) xin),在以雲計算為代表的技術創新大幕的襯(chen)托下,這些原本(ben)很難收集和使用的數據開始ji)菀妝煥悶鵠戳耍  饜xing)各業的不斷創新,大數據會逐步為人類創造(zao)更多的價值。

  其次,想要系統(tong)的認知大數據,必須要全面而細致的分(fen)解它,我著手(shou)從三個(ge)層面來展開︰

  第一(yi)層面是(shi)理論,理論是(shi)認知的mou)鼐 揪叮 彩shi)被huai)惴喝賢 痛 ?幕摺N一(yi)崠喲笫蕕奶卣鞫ding)義理解行(xing)業對大數據的整體描繪和定(ding)性;從對大數據價值的探討(tao)來深入(ru)解析大數據的珍貴所在;從對大數據的現在和未來去洞悉(xi)大數據的發展趨勢;從大數據隱私這個(ge)特別(bie)而重要的視角審視人和數據之間的長(chang)久博弈。

  第二層面是(shi)技術,技術是(shi)大數據價值體現的手(shou)段和前進的基石。我yi) fen)別(bie)從雲計算、分(fen)布式(shi)處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到jiao)緯山 guo)的整個(ge)過程(cheng)。

  第三層面是(shi)實踐,實踐是(shi)大數據的最終(zhong)價值體現。我yi) fen)別(bie)從互聯網的大數據,政府的大數據,企業的大數據和個(ge)人的大數據四個(ge)方面來描繪大數據已經展現的美(mei)好(hao)景象及即將實現的藍圖。

  和大數據相關(guan)的理論

   特征定(ding)義

  最早提(ti)出大數據時代到來的是(shi)麥肯(ken)錫︰“數據,已經滲透到jiang)dang)今每(mei)一(yi)個(ge)行(xing)業和業務(wu)職(zhi)能領域,成為重要的生產(chan)因素(su)。人們對于海量(liang)數據的挖掘(jue)和運用mang) ?shi)著新一(yi)波生產(chan)率shi)齔chang)和消(xiao)費者盈余浪shun)鋇牡嚼礎!/p>

  業界(IBM 最早定(ding)義)將大數據的特征歸納為4個(ge)“V”(量(liang)Volume,多樣Variety,價值Value,速Velocity),或者說特點(dian)有(you)四個(ge)層面︰第一(yi),數據體量(liang)巨大。大數據的起始計量(liang)單位至少是(shi)P(1000個(ge)T)、E(100萬個(ge)T)或Z(10億個(ge)T);第二,數據類型繁(fan)多。比如,網絡日志(zhi)、視頻、圖片(pian)、地理位置(zhi)信(xin)息等等qu)5諶 壑得芏鵲停 桃導壑蹈摺5謁模(mo)  硭俁瓤kuai)。最後這一(yi)點(dian)也是(shi)和傳統(tong)的數據挖掘(jue)技術有(you)著本(ben)質(zhi)的不同。

  其實這些V並不能真正說清楚大數據的所有(you)特征,下面這張圖對大數據的一(yi)些相關(guan)特性做出了有(you)xing)?乃得鰲/p>

  古(gu)語雲︰三分(fen)技術,七(qi)分(fen)zhi)藎 檬菡叩錳煜隆O炔宦鬯shui)說的mo)  shi)這句話an)惱que)性已經不hui)萌?壑zheng)了。維克song)小?醵舍恩伯格在《大數據時代》一(yi)書(shu)中(zhong)舉(ju)了百般例證(zheng),都(du)是(shi)為了說明一(yi)個(ge)道理︰在大數據時代已經到來的時候要用me)笫菟嘉 ? jue)大數據的潛(qian)在價值。書(shu)中(zhong),作者提(ti)及最多的是(shi)Google如何(he)利用人們的搜(sou)索記(ji)錄挖掘(jue)數據二次利用價值,比如預測某che)亓韝斜  那魘Amazon如何(he)利用用戶的購買和瀏(liu)覽歷史數據進行(xing)有(you)針對性的書(shu)籍(ji)購買推薦,以此有(you)xing) ti)升銷售量(liang);Farecast如何(he)利用過去十年所有(you)的航線機票價格打折數據,來預測用戶購買機票的時機是(shi)否合(he)適(shi)。

  那麼(me),什麼(me)是(shi)大數據思維?維克song)小?醵舍恩伯格認為,1-需(xu)要全部數據樣本(ben)而不是(shi)抽樣;2-關(guan)注(zhu)效率而不是(shi)精確(que)度;3-關(guan)注(zhu)相關(guan)性yuan)皇shi)因果(guo)關(guan)系。

  阿里巴巴的王(wang)堅對于大數據也有(you)一(yi)些獨特的見解,比如,

  “今天的數據不是(shi)大,真正有(you)意思的是(shi)數據變得在線了,這個(ge)恰恰是(shi)互聯網的特點(dian)。”

  “非互聯網時期的產(chan)品,功能一(yi)定(ding)是(shi)它的價值,今天互聯網的產(chan)品,數據一(yi)定(ding)是(shi)它的價值。”

  “你千萬不要想著pai)檬萑?慕yi)個(ge)業務(wu),這不是(shi)大數據。你一(yi)定(ding)是(shi)去做了一(yi)件以前做不了的事情。”

  特別(bie)是(shi)最後一(yi)點(dian),我是(shi)非常(chang)認同的mo) 笫蕕惱嬲壑翟謨詿叢zao),在于填補(bu)無(wu)數個(ge)還(huai)未實現zhi)目kong)白。

  有(you)人把數據比喻為蘊藏能量(liang)的煤(mei)礦。煤(mei)炭(tan)按照(zhao)性質(zhi)有(you)焦煤(mei)、無(wu)煙煤(mei)、肥煤(mei)、貧煤(mei)等que)fen)類,而露duan) mei)礦、深山煤(mei)礦的挖掘(jue)成本(ben)又不一(yi)樣。與此類似,大數據並不在“大”,而在于“有(you)用”。價值含(han)量(liang)、挖掘(jue)成本(ben)比數量(liang)更為重要。

   價值探討(tao)

  大數據是(shi)什麼(me)?投資者眼里是(shi)金光閃閃的兩個(ge)字︰資產(chan)。比如,Facebook上市時,評估機構評定(ding)的有(you)xing)?什chan)中(zhong)大部分(fen)都(du)是(shi)其社交網站上的數據。

  如果(guo)把大數據比作一(yi)種產(chan)業,那麼(me)這種產(chan)業實現盈利的關(guan)鍵,在于提(ti)高對數據的“加工能力”,通過“加工”實現zhi)蕕摹霸鮒怠薄/p>

  Target 超(chao)市以20多種zhi)吃釁詡湓懈究(jiu)贍芑 郝虻納唐肺 。  you)用戶的購買記(ji)錄作為數據來源,通過構建(jian)模(mo)型分(fen)析購買者的行(xing)為相關(guan)性,能準ji)que)的推斷出孕婦的具體臨盆時間,這樣Target的銷售部門就可以有(you)針對的在每(mei)個(ge)懷孕顧客的不同階段寄送(song)相應的產(chan)品優惠卷。

  Target的例子you)shi)一(yi)個(ge)很典型的案例,這樣印證(zheng)了維克song)小?醵舍恩伯格提(ti)過的一(yi)個(ge)很有(you)指(zhi)導意義的觀點(dian)︰通過找出一(yi)個(ge)關(guan)聯物(wu)並監(jian)控它,就可以預測未來。Target通過監(jian)測購買者購買商品的時間和品fen)擲醋既(ji)que)預測顧客的孕期,這就是(shi)對數據的二次利用的典型案例。如果(guo),我們通過采集駕駛員手(shou)zhi)PS數據,就可以分(fen)析出當(dang)前哪些道路正在堵車(che),並可以及時發布道路交通提(ti)醒;通過采集汽車(che)的GPS位置(zhi)數據,就可以分(fen)析城市的哪些區域停車(che)較多,這也代表該區域有(you)著較為活躍的人群,這些分(fen)析數據適(shi)合(he)賣給廣告投放(fang)商。

  不huai)guan)大數據的核心(xin)價值是(shi)不是(shi)預測,但是(shi)基于大數據形成shan)霾叩哪mo)式(shi)已經為不少的企業帶(dai)來了盈利和聲譽。

  從大數據的價值鏈條來分(fen)析,存在三種模(mo)式(shi)︰

  1- 手(shou)握大數據,但是(shi)沒hui)欣煤(mei)比較典型的是(shi)金融(rong)機構,電信(xin)行(xing)業,政府機構等qu)/p>

  2- 沒hui)惺藎  shi)知道如何(he)幫助(zhu)有(you)數據的人利用它;比較典型的是(shi)IT咨詢和服(fu)務(wu)企業,比如,埃森哲(zhe),IBM,Oracle等qu)/p>

  3- 既(ji)有(you)數據,又有(you)大數據思維;比較典型的是(shi)Google,Amazon,Mastercard等qu)/p>

  未來在大數據領域最具有(you)價值的是(shi)兩種zhi)攣wu)︰1-擁有(you)大數據思維的人,這種人可以將大數據的潛(qian)在價值轉化為實際利益;2-還(huai)未有(you)被大數據觸及過的業務(wu)領域。這些是(shi)還(huai)未被挖掘(jue)的油井(jing),金礦,是(shi)所謂jiang)睦逗!/p>

  Wal-Mart作為零售行(xing)業的巨頭,他們的分(fen)析人員會對每(mei)個(ge)階段的銷售記(ji)錄進行(xing)了全面的分(fen)析,有(you)一(yi)次他們無(wu)意中(zhong)發現雖不相關(guan)但很有(you)價值的數據,在美(mei)國的颶(ju)風來臨季節,超(chao)市的蛋撻和抵御颶(ju)風物(wu)品竟然銷量(liang)都(du)有(you)大幅增加,于是(shi)他們qin)雋艘yi)個(ge)明智決策,就是(shi)將蛋撻的銷售位置(zhi)移(yi)到了颶(ju)風物(wu)品銷售區域旁(pang)邊,看起來是(shi)為了方便用戶挑選,但是(shi)沒hui)邢氳降(jiang)疤 南liang)因此又提(ti)高了很多。

  還(huai)有(you)一(yi)個(ge)有(you)趣的例子,1948年遼沈戰役期間,司令員林彪要求每(mei)天要進行(xing)例常(chang)的“每(mei)日軍(jun)情匯報(bao)”,由值班參(can)謀(mou)讀(du)出下屬各個(ge)縱隊(dui)、師、團用電台報(bao)告的當(dang)日zhao)嬌kuang)和繳獲(huo)情況(kuang)。那幾乎是(shi)重復著千篇(pian)一(yi)律枯燥(zao)無(wu)味(wei)的數據︰hao)恐?慷dui)殲(jian)敵多少、俘(fu)虜多少;繳獲(huo)的火(huo)炮、車(che)輛多少,槍支、物(wu)資多少……有(you)一(yi)天,參(can)謀(mou)照(zhao)例匯報(bao)當(dang)日的戰況(kuang),林彪突然打斷他︰“剛(gang)才(cai)念的在胡(hu)家窩(wo)棚那個(ge)戰斗的繳獲(huo),你們听到了嗎?”大家都(du)很茫(mang)然,因為如此戰斗每(mei)天都(du)有(you)幾十起,不都(du)是(shi)差(cha)不多一(yi)模(mo)一(yi)樣的枯燥(zao)數字嗎?林彪掃視一(yi)周,見無(wu)人回答,便接連問(wen)了三句︰“為什麼(me)那里繳獲(huo)的短(duan)槍與長(chang)槍的mou)壤繞淥蕉仿願”“為什麼(me)那里繳獲(huo)和擊毀(hui)的小車(che)與大車(che)的mou)壤繞淥蕉仿願”“為什麼(me)在那里俘(fu)虜和擊斃的軍(jun)官與士兵(bing)的mou)壤繞淥蕉仿願”林彪司令員大步走向掛滿軍(jun)用地圖的牆壁(bi),指(zhi)著地圖上的那個(ge)點(dian)說︰“我猜想,不,我斷定(ding)!敵人的指(zhi)fu)鈾馱謖飫”果(guo)然,部隊(dui)很快(kuai)就抓住了敵方jiang)鬧zhi)fu)庸倭我yao)湘,並取(qu)得這場(chang)重要戰役的勝利。

  這些例子真實的反映(ying)在各行(xing)各業,探求數據價值取(qu)決于把握數據的人,關(guan)鍵是(shi)人的數據思維;與其說是(shi)大數據創造(zao)了價值,不如說是(shi)大數據思維觸發了新的價值增長(chang)。

   現在和未來

  我們先看看大數據在當(dang)下有(you)怎樣的杰出表現︰

  大數據幫助(zhu)政府實現zhi)諧chang)經濟調控、公共can)郎踩 婪丁 幟言? ?緇嵊唄奐jian)督;

  大數據幫助(zhu)城市預防犯(fan)罪(zui),實現智慧交通,提(ti)升緊急應急能力;

  大數據幫助(zhu)醫(yi)療機構建(jian)立患(huan)者的疾病風險跟蹤機制(zhi),幫助(zhu)醫(yi)藥企業提(ti)升藥品的臨床(chuang)使用效果(guo),幫助(zhu)艾滋病研究(jiu)機構為患(huan)者提(ti)供定(ding)制(zhi)的藥物(wu);

  大數據幫助(zhu)航空(kong)公司節省運營成本(ben),幫助(zhu)電信(xin)企業實現zhi)酆蠓fu)務(wu)質(zhi)量(liang)提(ti)升,幫助(zhu)保險企業識別(bie)欺詐騙保行(xing)為,幫助(zhu)快(kuai)遞公司監(jian)測分(fen)析運輸車(che)輛的故障險情以提(ti)前預警維修,幫助(zhu)電力公司有(you)xing) 侗bie)預警即將發生故障的設備;

  大數據幫助(zhu)電商公司向用戶推薦商品和服(fu)務(wu),幫助(zhu)旅游網站為旅游者提(ti)供心(xin)儀(yi)的旅游路線,幫助(zhu)二手(shou)zhi)諧chang)的買賣雙方找到最合(he)適(shi)的交易目標,幫助(zhu)用戶找到最合(he)適(shi)的商品購買時期、商家和最優惠價格;

  大數據幫助(zhu)企業提(ti)升營銷的針對性,降(jiang)低物(wu)流和庫存的成本(ben),減少投資的風險,以及幫助(zhu)企業提(ti)升廣告投放(fang)精準度;

  大數據幫助(zhu)娛樂(le)行(xing)業預測歌手(shou),歌曲,電影,電視劇的受(shou)歡dui) cheng)度,並為投資者分(fen)析評估拍(pai)一(yi)部kang)纈靶xu)要投入(ru)多少錢(qian)才(cai)最合(he)適(shi),否則就有(you)可能收不回成本(ben);

  大數據幫助(zhu)社交網站提(ti)供更準ji)que)的好(hao)友推薦,為用戶提(ti)供更精準的企業招聘信(xin)息,向用戶推薦可能喜歡的游戲以及適(shi)合(he)購買的商品。

  其實,這些還(huai)遠(yuan)遠(yuan)不huai)gou),未來大數據的身影應該無(wu)處不在,就算無(wu)法準ji)que)預測大數據終(zhong)會將人類社會帶(dai)往到哪種最終(zhong)形態,但我相信(xin)只(zhi)要發展腳(jiao)步在繼續(xu),因大數據而產(chan)生的mou)涓錮順(shun)苯 芸kuai)淹沒地球的每(mei)一(yi)個(ge)角落。

  比如,Amazon的最終(zhong)期望是(shi)︰“最成功的書(shu)籍(ji)推薦應該只(zhi)hui)幸yi)本(ben)書(shu),就是(shi)用戶要買的下一(yi)本(ben)書(shu)。”

  Google也希望當(dang)用戶在搜(sou)索時,最好(hao)的體驗是(shi)搜(sou)索結果(guo)只(zhi)包含(han)用戶所需(xu)要的內(na)容,而這並不需(xu)要用戶給予Google太多的提(ti)示(shi)。

  而當(dang)物(wu)聯網發展到達一(yi)定(ding)規(gui)模(mo)時,借(jie)助(zhu)條形碼、二維碼、RFID等能夠(gou)唯(wei)一(yi)標識產(chan)品,傳感器、可穿戴設備、智能感知、視頻采集、增強ken)質(zhi)檔燃際蹩墑迪質(zhi)凳鋇男xin)息采集和分(fen)析,這些數據能夠(gou)支撐智慧城市,智慧交通,智慧能源,智慧醫(yi)療,智慧環(huan)fan)5睦砟鐶xu)要,這些都(du)所謂jiang)鬧腔勱 shi)大數據的采集數據來源和服(fu)務(wu)範圍。

  未來的大數據除了將更好(hao)的解決社會問(wen)題,商業營銷問(wen)題,科學技術問(wen)題,還(huai)有(you)一(yi)個(ge)可預見的趨勢是(shi)以人為本(ben)的大數據方針。人才(cai)是(shi)地球的主宰,大部分(fen)的數據都(du)與人類有(you)關(guan),要通過大數據解決人的問(wen)題。

  比如,建(jian)立個(ge)人的數據中(zhong)xing)模(mo)  mei)個(ge)人的日常(chang)生活習慣,身體體征,社會網絡,知識能力,愛好(hao)性情,疾病嗜好(hao),情緒波動(dong)……換言之就是(shi)記(ji)錄ji)舜映(ying)鏨且(qie)豢唐鸕拿mei)一(yi)分(fen)zhi)mei)一(yi)秒(miao),將除了思維外(wai)的一(yi)切都(du)儲存下來,這些數據可以被充分(fen)的利用mang)/p>

  醫(yi)療機構將實時的監(jian)測用戶的身體健康(kang)狀況(kuang);

  教育機構更有(you)針對的制(zhi)定(ding)用戶喜歡的教育培訓計劃(hua);

  服(fu)務(wu)行(xing)業為用戶提(ti)供即時健康(kang)的符合(he)用戶生活習慣的食物(wu)和其它服(fu)務(wu);

  社交網絡能為你提(ti)供合(he)適(shi)的交hui)訊韻螅 ? zhi)同道合(he)的人群組織各種zhi)芻嶧畽dong);

  政府能在用戶的心(xin)理健康(kang)出現問(wen)題時有(you)xing)?母稍? 婪蹲隕保 淌擄訃姆?

  金融(rong)機構能幫助(zhu)用戶進行(xing)有(you)xing)?睦聿乒guan)理,為用戶的資shi) ti)供更有(you)xing)?氖褂媒jian)議和規(gui)劃(hua);

  道路交通、汽車(che)租賃及運輸行(xing)業可以為用戶提(ti)供更合(he)適(shi)的出行(xing)線路和路途服(fu)務(wu)安cai)pai);

  ……

  當(dang)然,上面的一(yi)切看起來都(du)很美(mei)好(hao),但是(shi)否是(shi)以犧牲了用戶的自由為前提(ti)呢?只(zhi)能說當(dang)新鮮shi)攣wu)帶(dai)來了革新的同時也can) dai)來了“病菌”。比如,在手(shou)zhi)雌佔扒埃 蠹蟻不毒ju)在一(yi)起聊天,自從you)shou)zhi)佔昂筇乇bie)是(shi)有(you)了互聯網,大家不hui)鎂ju)在一(yi)起也可以隨(sui)時隨(sui)地的聊天,只(zhi)是(shi)“病菌”滋生了另(ling)外(wai)一(yi)種情形,大家慢慢習慣了和手(shou)zhi)捕墑憊猓 擻肴酥 淝楦薪渙鞣路fu)永遠(yuan)隔著一(yi)張“網”。

   大數據隱私

  你或許(xu)並不敏感,當(dang)你在不同的網站上注(zhu)冊(ce)了個(ge)人信(xin)息後,可能這些信(xin)息已經被擴散出去了,當(dang)你莫名其妙的接到各種郵(you)件,電話,短(duan)信(xin)的滋擾(rao)時,你不會想到自己(ji)的電話號碼,郵(you)箱,生日,購買記(ji)錄,收入(ru)水平,家庭住址,親(qin)朋(peng)好(hao)友等私人信(xin)息早就被各種商業機構非法存儲或賤賣給其它任何(he)有(you)xing)枰 鈉笠禱蚋ge)人了。

  更可怕的是(shi),這些信(xin)息你永遠(yuan)無(wu)法刪(shan)jing) 怯澇yuan)存在于互聯網的某些你不知道的角落。除非你更換掉自己(ji)的所有(you)xing)畔   shi)這代價太大了。

  用戶隱私問(wen)題一(yi)直是(shi)大數據應用難以繞開的一(yi)個(ge)問(wen)題,如被央視曝(pu)光過的分(fen)眾無(wu)線、羅維鄧(deng)白氏(shi)以及網易郵(you)箱都(du)涉及侵犯(fan)用戶隱私。目前,中(zhong)國並沒hui)凶 諾姆 煞 gui)來界定(ding)用戶隱私,處理相關(guan)問(wen)題時多采用其他相關(guan)法規(gui)條例來解釋(shi)。但隨(sui)著民眾隱私意識的日益增強,合(he)法合(he)規(gui)地獲(huo)取(qu)數據、分(fen)析數據和應用數據,是(shi)進行(xing)大數據分(fen)析時必須遵循的原則。

  說到隱私被侵犯(fan),愛德華斯gu)檔怯Ω謎季菀yi)席之地,這位前美(mei)國中(zhong)央情報(bao)局(CIA)雇員一(yi)手(shou)引(yin)爆了美(mei)國“稜鏡計劃(hua)”(PRISM)的內(na)幕消(xiao)息。“稜鏡”項目是(shi)一(yi)項由美(mei)國國家安全局(NSA)自2007年起開始實施的絕(jue)密電子監(jian)听計劃(hua),年耗資shi)jin)2000億美(mei)元(yuan),用于監(jian)听全美(mei)電話通話記(ji)錄,據稱還(huai)可以使情報(bao)人員通過“後門”進入(ru)9家主要科技公司的服(fu)務(wu)器,包括(kuo)微(wei)軟、雅虎、谷歌、Facebook、PalTalk、美(mei)國在線、Skype、YouTube、隻huai)guo)。這個(ge)事件引(yin)發了人們對政府使用me)笫菔倍怨 褚角址fan)的擔心(xin)。

  再看看我們身邊,當(dang)微(wei)博,微(wei)信(xin),QQ空(kong)間這些社交平台肆意的吞噬著數億用戶的各種zhong)畔?保 憔筒灰 zhi)望你還(huai)有(you)隱私權了,就算你在某個(ge)地方刪(shan)jing)耍  殘xu)這些信(xin)息已經被其他人轉載或保存了,更有(you)可能已經被百度或Google存為快(kuai)照(zhao),早就提(ti)供給任意用戶搜(sou)索了。

  因此在大數據的mou)塵跋攏 芏噯碩du)在積極(ji)的抵制(zhi)無(wu)底線的數字zhi)  庵執笫鶯透ge)體之間的博弈還(huai)gou)嵋yi)直繼續(xu)下去……

  專家給予了我們qie)恍┤綰he)有(you)xing)?;?笫荼塵跋亂餃 慕jian)議︰1-減少信(xin)息的數字zhi)2-隱私權立法;3-數字隱私權基礎設施(類似DRM數字zhi)嬡 guan)理);4-人類改mou)淙現接you)shou)忽(hu)略過去);5-創造(zao)良性的信(xin)息生態;6-語境(jing)化。

  但是(shi)這些都(du)很難立即見效或者有(you)實質(zhi)性的改善。

  比如,現在有(you)一(yi)種職(zhi)業叫(jiao)刪(shan)帖人,專門負責幫人到各大網站刪(shan)帖,刪(shan)jing)纜邸F涫嫡廡┤司褪shi)通過黑(hei)客技術侵入(ru)各大網站,破獲(huo)管(guan)理員的密碼然後進行(xing)手(shou)zhi)?ding)向刪(shan)jing)Vzhi)不huai)潛(qian);?牟皇shi)客戶的隱私,而大多是(shi)丑聞(wen)。還(huai)有(you)一(yi)種職(zhi)業叫(jiao)人肉專家,他們負責從互聯網上找到一(yi)個(ge)與他們根本(ben)就無(wu)關(guan)系用戶的任意信(xin)息。這是(shi)很可怕的事情,也就是(shi)說,如果(guo)有(you)人想找到你,只(zhi)需(xu)要兩個(ge)條件︰1-你上過網,留下過痕(hen)跡;2-你的親(qin)朋(peng)好(hao)友或僅(jin)僅(jin)是(shi)認識你的人上過網,留下過你的痕(hen)跡。這兩個(ge)條件滿足其一(yi),人肉專家就可以很輕松的找到你,可能還(huai)知道你現在正在某個(ge)餐(can)廳和誰(shui)一(yi)起共進晚(wan)餐(can)。

  當(dang)很多互聯網企業意識到隱私對于用戶的重要性時,為了繼續(xu)得到用戶的信(xin)任,他們采取(qu)了很多辦法,比如google承xin)到jin)保留用戶的搜(sou)索記(ji)錄9個(ge)月,瀏(liu)覽器廠商提(ti)供了無(wu)痕(hen)沖浪模(mo)式(shi),社交網站拒絕(jue)公共搜(sou)索引(yin)擎的爬蟲進入(ru),並將提(ti)供出去的數據全部采取(qu)匿名方式(shi)處理等qu)/p>

  在這種zhi)叢擁幕huan)境(jing)里面,很多人依然沒hui)薪jian)立對于信(xin)息隱私jiang)謀(mou);?饈叮 米約ji)一(yi)直處于被滋擾(rao),被精心(xin)設計,被利用mang) 患(huan)嗍擁拇 jing)中(zhong)。可是(shi),我們能做的幾乎微(wei)乎其微(wei),因為個(ge)人隱私數據已經無(wu)法由我們qin)約ji)掌控了,就像一(yi)首詩里說到jiang)模(mo)骸叭綣guo)你現在繼續(xu)麻(ma)木,那就別(bie)指(zhi)望這麻(ma)木能抵擋得住被”扒光”那qie)豢痰木 趾途jue)望……”

  和大數據相關(guan)的技術

   雲技術

  大數據常(chang)和雲計算聯系到一(yi)起,因為實時的大型數據集分(fen)析需(xu)要分(fen)布式(shi)處理框架來向數十、數百或甚(shen)至數萬的電腦分(fen)配工作。可以說,雲計算充當(dang)了工業革命時期的發動(dong)機的角色,而大數據則是(shi)電。

  雲計算思想的起源是(shi)麥卡錫在上世紀60年代提(ti)出的mo)喊鴨撲隳芰ψ魑 yi)種像水和電一(yi)樣的公用事業提(ti)供給用戶。

  如今,在Google、Amazon、Facebook等一(yi)批(pi)互聯網企業引(yin)領下,一(yi)種zhong)xing)之有(you)xing)?哪mo)式(shi)出現了︰雲計算提(ti)供基礎架構平台,大數據應用運行(xing)在這個(ge)平台上。

  業內(na)是(shi)這麼(me)形容兩者的關(guan)系︰hao)揮(hui)寫笫蕕男xin)息積澱,則雲計算的計算能力再強大,也難以找到用武之地;沒hui)性萍撲愕拇 砟芰Γ 虼笫蕕男xin)息積澱再豐富(fu),也終(zhong)究(jiu)只(zhi)是(shi)鏡花水月。

  那麼(me)大數據到jiang)仔xu)要哪些雲計算技術呢?

  這里暫且(qie)列(lie)舉(ju)一(yi)些,比如虛擬化技術,分(fen)布式(shi)處理技術,海量(liang)數據的存儲和管(guan)理技術,NoSQL、實時流數據處理、智能分(fen)析技術(類似模(mo)式(shi)識別(bie)以及自然hui)鋂岳斫等qu)/p>

  雲計算和大數據之間的關(guan)系可以用下面的一(yi)張圖來說明,兩者之間結合(he)後會產(chan)生如下效應︰可以提(ti)供更多基于海量(liang)業務(wu)數據的創新型服(fu)務(wu);通過雲計算技術的不斷發展降(jiang)低大數據業務(wu)的創新成本(ben)。

  如果(guo)將雲計算與大數據進行(xing)一(yi)些比較,最明顯(xian)的區分(fen)在兩個(ge)方面︰

  第一(yi),在概(gai)念上兩者有(you)所不同,雲計算改mou)淞T,而大數據則改mou)淞艘滴wu)。然而大數據必須有(you)雲作為基礎架構,才(cai)能得以順(shun)暢(chang)運營。

  第二,大數據和雲計算的目標受(shou)眾不同,雲計算是(shi)CIO等關(guan)心(xin)的技術層,是(shi)一(yi)個(ge)進階的IT解決方案。而大數據是(shi)CEO關(guan)注(zhu)的、是(shi)業務(wu)層的產(chan)品,而大數據的決策者是(shi)業務(wu)層。

   分(fen)布式(shi)處理技術

  分(fen)布式(shi)處理系統(tong)可以將不同地點(dian)的或具有(you)不同功能的或擁有(you)不同數據的多台計算機用通信(xin)網絡連接起來,在控制(zhi)系統(tong)的統(tong)一(yi)管(guan)理控制(zhi)下,協(xie)調地完成信(xin)息處理任務(wu)—這就是(shi)分(fen)布式(shi)處理系統(tong)的定(ding)義。

  以Hadoop(Yahoo)為例進行(xing)說明,Hadoop是(shi)一(yi)個(ge)實現了MapReduce模(mo)式(shi)jiang)哪芄gou)對大量(liang)數據進行(xing)分(fen)布式(shi)處理的軟件框架,是(shi)以一(yi)種可靠、高效、可伸縮的方式(shi)進行(xing)處理的。

  而MapReduce是(shi)Google提(ti)出的一(yi)種雲計算的核心(xin)計算模(mo)式(shi),是(shi)一(yi)種分(fen)布式(shi)運算技術,也是(shi)簡化的分(fen)布式(shi)編程(cheng)模(mo)式(shi),MapReduce模(mo)式(shi)jiang)鬧饕 枷朧shi)將自yuan)dong)分(fen)割(ge)要執行(xing)的問(wen)題(例如程(cheng)序(xu))拆解成map(映(ying)射)和reduce(化簡)的方式(shi),在數據被huan)fen)割(ge)後通過Map 函數的程(cheng)序(xu)將數據映(ying)射成不同的區塊,分(fen)配給計算機機群處理達到分(fen)布式(shi)運算的效果(guo),在通過Reduce 函數的程(cheng)序(xu)將結果(guo)匯整,從而輸出開發者需(xu)要的結果(guo)。

  再來看看Hadoop的特性,第一(yi),它是(shi)可靠kang)模(mo) 蛭 偕杓撲閽yuan)素(su)和存儲會失敗,因此它維護多個(ge)工作數據副本(ben),確(que)fan)D芄gou)針對失敗的節點(dian)重新分(fen)布處理。其次,Hadoop 是(shi)高效的mo) 蛭 圓 xing)的方式(shi)工作,通過並行(xing)處理加快(kuai)處理速度qu)adoop 還(huai)是(shi)可伸縮的mo) 芄gou)處理 PB 級數據。此song)wai),Hadoop 依賴于社區服(fu)務(wu)器,因此它的成本(ben)比較低,任何(he)人都(du)可以使用。

  你也可以這麼(me)理解Hadoop的構成,Hadoop=HDFS(文(wen)件系統(tong),數據存儲技術相關(guan)) HBase(數據庫) MapReduce(數據處理) ……Others

  Hadoop用到jiang)囊yi)些技術有(you)︰

  HDFS: Hadoop分(fen)布式(shi)文(wen)件系統(tong)(Distributed File System) - HDFS (HadoopDistributed File System)

  MapReduce︰並行(xing)計算框架

  HBase: 類似Google BigTable的分(fen)布式(shi)NoSQL列(lie)數據庫。

  Hive︰數據倉庫工具,由Facebook貢獻。

  Zookeeper︰分(fen)布式(shi)鎖設施,提(ti)供類似Google Chubby的功能,由Facebook貢獻。

  Avro︰新的數據序(xu)列(lie)化格式(shi)與傳輸工具,將逐步取(qu)代Hadoop原有(you)的IPC機制(zhi)。

  Pig:大數據分(fen)析平台,為用戶提(ti)供多種接口(kou)。

  Ambari︰Hadoop管(guan)理工具,可以快(kuai)捷的監(jian)控、部署、管(guan)理集群。

  Sqoop︰用于在Hadoop與傳統(tong)的數據庫間進行(xing)數據的傳遞。

  說了這麼(me)多,舉(ju)個(ge)實際的例子,雖然這個(ge)例子有(you)xing)┌戮桑  shi)淘寶的海量(liang)數據技術架構gou)故shi)有(you)助(zhu)于我們理解對于大數據的運作處理機制(zhi):

  如上圖所示(shi),淘寶的海量(liang)數據產(chan)品技術架構分(fen)為五(wu)個(ge)層次,從上至liao)呂純此欠fen)別(bie)是(shi)︰數據源,計算層,存儲層,查詢層和產(chan)品層。

  數據來源chuang)恪4娣fang)著pan)員Ω韉甑慕灰資蕁T謔菰床(chuang)悴chan)生的數據,通過DataX,DbSync和Timetunel準實時的傳輸到下面第2點(dian)所述(shu)的“雲梯”。

  計算層。在這個(ge)計算層內(na),淘寶采用的是(shi)Hadoop集群,這個(ge)集群,我們暫且(qie)稱之為雲梯,是(shi)計算層的主要組成部分(fen)。在雲梯上,系統(tong)每(mei)天會對數據產(chan)品進行(xing)不同的MapReduce計算。

  存儲層。在這一(yi)層,淘寶采用了兩個(ge)東西,一(yi)個(ge)使MyFox,一(yi)個(ge)是(shi)Prom。MyFox是(shi)基于MySQL的分(fen)布式(shi)關(guan)系型數據庫的集群,Prom是(shi)基于Hadoop Hbase技術的一(yi)個(ge)NoSQL的存儲集群。

  查詢層。在這一(yi)層中(zhong),Glider是(shi)以HTTP協(xie)議對外(wai)提(ti)供restful方式(shi)jiang)慕涌kou)。數據產(chan)品通過一(yi)個(ge)唯(wei)一(yi)的URL來獲(huo)取(qu)到它想要的數據。同時,數據查詢即是(shi)通過MyFox來chuang)檠 摹/p>

  最後一(yi)層是(shi)產(chan)品層,這個(ge)就不hui)媒饈shi)了。

   存儲技術

  大數據可以抽象的分(fen)為大數據存儲和大數據分(fen)析,這兩者的關(guan)系是(shi)︰大數據存儲的目kang)氖shi)支撐大數據分(fen)析。到目前為止(zhi),還(huai)是(shi)兩種截然不同的計算機技術領域︰大數據存儲致力于研發可以擴展至PB甚(shen)至EB級別(bie)的數據存儲平台;大數據分(fen)析關(guan)注(zhu)在最短(duan)時間內(na)處理大量(liang)不同類型的數據集。

  提(ti)到存儲,有(you)一(yi)個(ge)著(zhu)名的摩爾定(ding)律相信(xin)大家都(du)听過︰18個(ge)月集成電路的復雜you)躍馱黽右yi)倍。所以,存儲器的成本(ben)大約每(mei)18-24個(ge)月就下降(jiang)一(yi)半。成本(ben)的不斷下降(jiang)也造(zao)就了大數據的可存儲性。

  比如,Google大約管(guan)理著超(chao)過50萬台服(fu)務(wu)器和100萬塊硬cai)pan),而且(qie)Google還(huai)在不斷的擴大計算能力和存儲能力,其中(zhong)很多的擴展都(du)是(shi)基于在廉價服(fu)務(wu)器和普通存儲硬cai)pan)的基礎上進行(xing)的mo) 獯蟠蠼jiang)低了其服(fu)務(wu)成本(ben),因此可以將更多的資shi)鶩度ru)到技術的研發當(dang)中(zhong)。

  以Amazon舉(ju)例,Amazon S3 是(shi)一(yi)種zhi)嫦Internet 的存儲服(fu)務(wu)。該服(fu)務(wu)旨在讓mei) ?嗽蹦芨崴傻慕xing)網絡規(gui)模(mo)計算。Amazon S3 提(ti)供一(yi)個(ge)簡明的 Web 服(fu)務(wu)界面,用戶可通過它隨(sui)時在 Web 上的任何(he)位置(zhi)存儲和檢索的任意大小的數據。此服(fu)務(wu)讓所有(you)開發人員都(du)能訪問(wen)同一(yi)個(ge)具備高擴展性、可靠性、安全性和快(kuai)速價廉的基礎設施,Amazon 用它來運行(xing)其全球的網站網絡。再看看S3的設計指(zhi)標︰在特定(ding)年度內(na)為數據元(yuan)提(ti)供 99.999999999% 的耐久性和 99.99% 的可用性,並能夠(gou)承受(shou)兩個(ge)設施中(zhong)的數據同時丟失。

  S3很成功也確(que)實卓有(you)成效,S3雲的存儲對象已達到萬億級別(bie),而且(qie)性能表現相當(dang)良ji)hao)。S3雲已經擁萬億跨(kua)地域存儲對象,同時AWS的對象執行(xing)請求也達到百萬的峰值數量(liang)。目前全球範圍內(na)已經有(you)數以十萬計的企業在通過AWS運行(xing)自己(ji)的全部或者部分(fen)日常(chang)業務(wu)。這些企業用戶遍布190多個(ge)國家,幾乎世界上的每(mei)個(ge)角落都(du)有(you)Amazon用戶的身影。

   感知技術

  大數據的采集和感知技術的發展是(shi)緊密聯系的。以傳感器技術,指(zhi)紋識別(bie)技術,RFID技術,坐標定(ding)位huan)際醯任 〉母兄 芰μti)升同樣是(shi)物(wu)聯網發展的基石。全世界的工業設備、汽車(che)、電表上有(you)著無(wu)數的數碼傳感器,隨(sui)時測量(liang)和傳遞著有(you)關(guan)位置(zhi)、運動(dong)、震動(dong)、溫度qu)? 饒酥量(liang)掌zhong)化學物(wu)質(zhi)的mou)浠  du)會產(chan)生海量(liang)的數據信(xin)息。

  而隨(sui)著智能手(shou)zhi)鈉佔埃 兄﹤際蹩晌接 戳朔 溝母叻迤冢 說乩砦恢zhi)信(xin)息被huai)惴旱撓τ猛wai),一(yi)些新的感知手(shou)段也開始登上舞台,比如,最新的”iPhone 5S”在home鍵內(na)嵌指(zhi)紋傳感器,新型手(shou)zhi)賞 hu)氣直接檢測燃燒脂肪量(liang),用于手(shou)zhi)男峋jue)傳感器面世可以監(jian)測從空(kong)氣污染(ran)到危險的化學藥品,微(wei)軟正在研發可感知用戶當(dang)前心(xin)情智能手(shou)zhi)際  雀柩劬nSight新技術可通過衣著進行(xing)人物(wu)識別(bie)。

  除此之外(wai),還(huai)有(you)很多與感知相關(guan)的技術革新讓我們耳目一(yi)新︰比如,牙(ya)齒傳感器實時監(jian)控口(kou)腔活動(dong)及飲食狀況(kuang),嬰兒穿戴設備可用me)笫萑?ΡΓntel正研發3D筆記(ji)qian)舊閬褳房勺zhui)蹤眼球讀(du)懂情緒,日本(ben)公司jiu)  灤涂杉jian)控用戶心(xin)率的紡織材料(liao),業界正在嘗試(shi)將生物(wu)測定(ding)技術引(yin)入(ru)支付du) 虻取(qu)/p>

  其實,這些感知被逐漸捕獲(huo)的過程(cheng)就是(shi)就世界被數據化的過程(cheng),一(yi)旦世界被完全數據化了,那麼(me)世界的mou)局zhi)也就是(shi)信(xin)息了。

  就像一(yi)句名言所說,“人類以前延you)氖shi)文(wen)明,現在傳承的是(shi)信(xin)息。”

  大數據的實踐

  互聯網的大數據

  互聯網上的數據每(mei)年增長(chang)50%,每(mei)兩年便將翻一(yi)番,而目前世界上90%以上的數據是(shi)最近(jin)幾年才(cai)產(chan)生的。據IDC預測,到2020年全球將總共擁有(you)35ZB的數據量(liang)。互聯網是(shi)大數據發展的前哨陣地,隨(sui)著WEB2.0時代的發展,人們似乎都(du)習慣了將自己(ji)的生活通過網絡進行(xing)數據化,方便分(fen)享以及記(ji)錄並回憶。

  互聯網上的大數據很難清晰的界定(ding)分(fen)類界限,我們先看看BAT的大數據︰

  百度擁有(you)兩種類型的大數據︰用戶搜(sou)索表征的需(xu)求數據;爬蟲和阿拉丁獲(huo)取(qu)的公共web數據。搜(sou)索巨頭百度圍繞數據而生。它對網頁數據的爬取(qu)、網頁chen)na)容的組織和解析,通過語義分(fen)析對搜(sou)索需(xu)求的精準理解進而從海量(liang)數據中(zhong)找準結果(guo),以及精準的搜(sou)索引(yin)擎關(guan)鍵字zhi)愀媯 抵zhi)上就是(shi)一(yi)個(ge)數據的獲(huo)取(qu)、組織、分(fen)析和挖掘(jue)的過程(cheng)。搜(sou)索引(yin)擎在大數據時代面臨的挑戰有(you)︰更多的暗(an)網數據;更多的WEB化但是(shi)沒hui)薪 夠(gou) 氖更多的WEB化、結構gou)  shi)封閉的數據。

  阿里巴巴擁有(you)交易數據和信(xin)用數據。這兩種zhi)莞菀妝湎鄭 誥jue)出商業價值。除此之外(wai)阿里巴巴還(huai)通過投資等que)絞shi)掌握了部分(fen)社交數據、移(yi)動(dong)數據。如微(wei)博和高德。

  騰訊dui)滌you)用戶關(guan)系數據和基于此產(chan)生的社交數據。這些數據可以分(fen)析人們的生活和行(xing)為,從里面挖掘(jue)出政治、社會、文(wen)化、商業、健康(kang)等領域的信(xin)息,甚(shen)至預測未來。

  在信(xin)息技術更為發達的美(mei)國,除了行(xing)業知名的類似Google,Facebook外(wai),已經涌ken)至撕芏啻笫堇嘈偷墓 荊 親(qin) 啪  薟chan)品,比如︰

  Metamarkets︰這家公司對Twitter、支付、簽(qian)到和一(yi)些與互聯網相關(guan)的問(wen)題進行(xing)了分(fen)析,為客戶提(ti)供了很好(hao)的數據分(fen)析支持。

  Tableau︰他們的精力主要集中(zhong)于將海量(liang)數據以可視化的方式(shi)展現出來。Tableau為數字zhi)教逄ti)供了一(yi)個(ge)新的展示(shi)數據的方式(shi)。他們提(ti)供了一(yi)個(ge)免費工具,任何(he)人在沒hui)斜喑cheng)知識背景an)那榭kuang)下都(du)能制(zhi)造(zao)出數據專用圖表。這個(ge)軟件還(huai)能對數據進行(xing)分(fen)析,並提(ti)供有(you)價值的建(jian)議。

  ParAccel︰他們向美(mei)國執法機構提(ti)供了數據分(fen)析,比如對15000個(ge)有(you)犯(fan)罪(zui)前科的人進行(xing)跟蹤,從而向執法機構提(ti)供了參(can)考性較高的犯(fan)罪(zui)預測。他們是(shi)犯(fan)罪(zui)的預言者。

  QlikTech︰QlikTech旗下的Qlikview是(shi)一(yi)個(ge)商業智能領域的自主服(fu)務(wu)工具,能夠(gou)hui)τ糜誑蒲 芯jiu)和藝術等領域。為了幫助(zhu)開發者對這些數據進行(xing)分(fen)析,QlikTech提(ti)供了對原始數據進行(xing)可視化處理等功能的工具。

  GoodData︰GoodData希望幫助(zhu)客戶從you) zhong)挖掘(jue)財富(fu)。這家創業公司主要面向商業用戶和IT企業高管(guan),提(ti)供數據存儲、性能報(bao)告、數據分(fen)析等工具。

  TellApart︰TellApart和電商公司進行(xing)合(he)作,他們會根據用戶的瀏(liu)覽行(xing)為等數據進行(xing)分(fen)析,通過鎖定(ding)潛(qian)在買家方式(shi)提(ti)高電商企業的收入(ru)。

  DataSift︰DataSift主要收集並分(fen)析社交網絡媒體上的數據,並幫助(zhu)品fang)乒 菊莆脹環(huan) 攣wen)的輿論點(dian),並制(zhi)定(ding)有(you)針對性的營銷方案。這家公司還(huai)和Twitter有(you)合(he)作協(xie)議,使得自己(ji)變成了行(xing)業中(zhong)為數不多可以分(fen)析早期tweet的創業公司。

  Datahero︰公司的目標是(shi)將復雜的數據變得更加簡單明了,方便普通人去理解和想象。

  舉(ju)了很多例子,這里簡要歸納一(yi)下,在互聯網大數據的典型代表性包括(kuo)︰

  1-用戶行(xing)為數據(精準廣告投放(fang)、內(na)容推薦、行(xing)為習慣和喜好(hao)分(fen)析、產(chan)品優化等)

  2-用戶消(xiao)費數據(精準營銷、信(xin)用記(ji)錄分(fen)析、活動(dong)促銷、理財等)

  3-用戶地理位置(zhi)數據(O2O推廣,商家推薦,交hui)淹萍齙

  4-互聯網金融(rong)數據(P2P,小額貸款(kuan),支付,信(xin)用mang) ┬α唇鶉rong)等)

  5-用戶社交等UGC數據(趨勢分(fen)析、流行(xing)元(yuan)素(su)分(fen)析、受(shou)歡dui) cheng)度que)fen)析、輿論監(jian)控分(fen)析、社會問(wen)題分(fen)析等)

   政府的大數據

  近(jin)期,奧巴馬政府宣(xuan)布投資2億美(mei)元(yuan)拉動(dong)大數據相關(guan)產(chan)業發展,將“大數據戰略”上升為國家意志(zhi)。奧巴馬政府將數據定(ding)義為“未來的新石油”,並表示(shi)一(yi)個(ge)國家擁有(you)數據的規(gui)模(mo)、活性及解釋(shi)運用的能力將成為綜(zong)合(he)國力的重要組成部分(fen),未來,對數據的佔有(you)和控制(zhi)甚(shen)至將成為陸權、海權、空(kong)權之外(wai)的另(ling)一(yi)種zhi)液誦xin)資產(chan)。

  在國內(na),政府各個(ge)部門都(du)握有(you)構成社會基礎的原始數據,比如,氣象數據,金融(rong)數據,信(xin)用數據,電力數據,煤(mei)氣數據,自來水數據,道路交通數據,客運數據,安全刑事案件數據,住房數據,海關(guan)數據,出入(ru)境(jing)數據,旅游wen)藎 yi)療數據,教育數據,環(huan)fan)J蕕鵲取(qu)U廡┤菰諉mei)個(ge)政府部門里面看起來是(shi)單一(yi)的mo) jing)態的。但是(shi),如果(guo)政府可以將這些數據關(guan)聯起來,並對這些數據進行(xing)有(you)xing)?墓guan)聯分(fen)析和統(tong)一(yi)管(guan)理,這些數據必定(ding)將獲(huo)得新生,其價值是(shi)無(wu)法估量(liang)的。

  具體來說,現在城市都(du)在走向智能和智慧,比如,智能電網、智慧交通、智慧醫(yi)療、智慧環(huan)fan)! 腔鄢鞘校 廡┐du)依托于大數據,可以說大數據是(shi)智慧的核心(xin)能源。從國內(na)整體投資規(gui)模(mo)來看,到2012年底全國開建(jian)智慧城市的城市數超(chao)過180個(ge),通信(xin)網絡和數據平台等基礎設施建(jian)設投資規(gui)模(mo)接近(jin)5000億元(yuan)。“十二五(wu)”期間智慧城市建(jian)設拉動(dong)的設備投資規(gui)模(mo)將達1萬億元(yuan)人民幣。大數據為智慧城市的各個(ge)領域提(ti)供決策支持。在城市規(gui)劃(hua)方面,通過對城市地理、氣象等自然信(xin)息和經濟、社會、文(wen)化、人口(kou)等人文(wen)社會信(xin)息的挖掘(jue),可以為城市規(gui)劃(hua)提(ti)供決策,強化城市管(guan)理服(fu)務(wu)的科學性和前瞻(zhan)性。在交通管(guan)理方面,通過對道路交通信(xin)息的實時挖掘(jue),能有(you)xing)?航飩煌ㄓ刀攏  kuai)速響應突huan) 純kuang),為城市交通的良性運轉提(ti)供科學的決策依據。在輿情監(jian)控方面,通過網絡關(guan)鍵詞搜(sou)索及語義智能分(fen)析,能提(ti)高輿情分(fen)析的及時性、全面性,全面掌握社情民意,提(ti)高公共服(fu)務(wu)能力,應對網絡突huan) 墓 彩錄 蚧魑? fan)罪(zui)。在安防與防災領域,通過大數據的挖掘(jue),可以及時發現人為或自然災害、恐怖lang)錄 ti)高應急處理能力和安全防範能力。

  另(ling)外(wai),作為國家的管(guan)理者,政府應該有(you)勇氣將手(shou)中(zhong)的數據逐步開放(fang),供給更多有(you)xin)芰Φ幕棺櫓 蚋ge)人來分(fen)析並加以利用mang) 約鈾僭zao)福人類。比如,美(mei)國政府就tong)鎝jian)了一(yi)個(ge)data.gov網站,這是(shi)奧巴馬任期內(na)的一(yi)個(ge)重要舉(ju)措︰要求政府公開透明,而核心(xin)就是(shi)實現zhong) 溝氖莨  =?zhi)目前,已經開放(fang)了有(you)91054 個(ge)datasets;349citizen-developed apps;137 mobile apps;175 agencies and subagencies;87 galleries;295 Government APIs。

分(fen)享︰
延伸閱讀(du)
    速讀(du)區塊鏈
    貴州

    貴州大數據產(chan)業政策

    貴州大數據企業

    更多
    大數據概(gai)念_大數據分(fen)析_大數據應用_大數據百科專題
    企業
    更多
    五百彩票快三 | 下一页