- 相關(guān)推薦
《大數(shù)據(jù)時代》讀后感心得2000字以上
凡是過去,皆為序曲是大數(shù)據(jù)業(yè)者最喜歡引用的語句,
《大數(shù)據(jù)時代》讀后感心得2000字以上
。大數(shù)據(jù)是現(xiàn)在的潮流,《大數(shù)據(jù)時代》被認為是了解大數(shù)據(jù)的初級讀物。近期連續(xù)讀了兩遍,第二遍是為了寫這篇讀后感,總體而言,值得一看,但細節(jié)方面卻需要討論了。維基百科對大數(shù)據(jù)的解釋:Big data,或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達到截取、管理、處理、并整理成為人類所能解讀的信息。
有人說現(xiàn)在是讀圖時代,除去小說、心靈雞湯以外,現(xiàn)在的暢銷書基本都有圖片,這本書是一個特例(書里唯一的圖是出品方湛廬文化做的)
首先嘗試解析一下作者的三大觀點,這三大觀點是大數(shù)據(jù)業(yè)者很喜歡引用的三句話:
1 不是隨機樣本,而是全體數(shù)據(jù)
我想所有人都能意識到對全體數(shù)據(jù)的分析優(yōu)于對隨機樣本的分析,但在現(xiàn)實中我們經(jīng)常拿不到全體數(shù)據(jù):一是對象的特性:比如炸彈的威力,你不可能把所有炸彈都炸掉來得到全體數(shù)據(jù);二是數(shù)據(jù)的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;三是數(shù)據(jù)分析的角度,戰(zhàn)斗機只能統(tǒng)計到飛回來的飛機上的彈孔,而墜毀的則無法統(tǒng)計,沃德通過分析飛回來的戰(zhàn)斗機得出來最易導致墜毀的薄弱點;四是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數(shù)據(jù)。“采樣分析是信息缺乏時代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物”,作者顯然只關(guān)注了一部分原因。
從語言的理解上看,什么是全體數(shù)據(jù),究竟是“我們需要的所有數(shù)據(jù)”,還是“我們能收集到的所有數(shù)據(jù)”,書中的很多商業(yè)案例中,處理的只是“我們能收集到的所有數(shù)據(jù)”,或者說是“我們認為的全體數(shù)據(jù)”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“Farecast使用了每一條航線整整一年的價格數(shù)據(jù)來進行預測”,而“整整一年”就是一個采樣,或者是“我們需要的所有數(shù)據(jù)”。
從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現(xiàn)“世界知識總匯”的夢想,國內(nèi)的乾隆匯編四庫全書,每個收集的過程都有主觀因素在里面,而他們當時都認為可以收集全部的書籍,到最后,我們也沒有得到那個夢中的全體。
2 不是精確性,而是混雜性
既然我們過去總是在抽樣,那本身就是在一個置信水平下,有明確的容錯度或者是偏差值。人類永遠知道我們是在精確性受限的條件下工作。同時,作者本身也承認 “錯誤并不是大數(shù)據(jù)固有的特性,而是一個亟需我們?nèi)ヌ幚淼默F(xiàn)實問題,并且有可能長期存在”。那大數(shù)據(jù)的特征究竟是精確性還是混雜性?
由此衍生出一個問題,大數(shù)據(jù)的品質(zhì)如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數(shù)據(jù)時代?這里的邏輯我沒有理順)。就像品質(zhì)管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結(jié)構(gòu)化數(shù)據(jù)的處理,譬如說對新聞的量化、情感的分析,目前對非SQL的應用還有巨大的進步空間,
資料共享平臺
《《大數(shù)據(jù)時代》讀后感心得2000字以上》(http://www.msguai.com)。“一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”。“通過找出一個關(guān)聯(lián)物并監(jiān)控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之于項目管理行業(yè),如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環(huán)節(jié)中出了問題,我們也失去了很多次挽救的機會。而我們一味的容忍混雜性的話,結(jié)果顯然是不能接受的。
3 不是因果關(guān)系,而是相關(guān)關(guān)系
這是本書對大數(shù)據(jù)理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。
相關(guān)關(guān)系我實在是太熟了,打小就學的算命就是典型的“不是因果關(guān)系,而是相關(guān)關(guān)系”。算命其實是對趨向性的總結(jié),在給定條件下,告訴你需要遠離什么,接近什么,但不會告訴你為什么那樣做。
我們很多時候都在說科學,然而,什么是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內(nèi)樹立一個強制正確的公理;三、有明確的推演過程;四 可以復制。科學的霸道體現(xiàn)在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數(shù)據(jù)不符合科學。
混沌學理論中的蝴蝶效應主要關(guān)注相關(guān)關(guān)系。它是指對初始條件敏感性的一種依賴現(xiàn)象,輸入端微小的差別會迅速放大到輸出端,但能輸出什么,誰也不知道。
人類一旦放棄了對因果關(guān)系的追求,也就放棄了自身最優(yōu)秀的品質(zhì):意志力。很多人不愿意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關(guān)關(guān)系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務(wù)發(fā)出去,大概能預測到哪些環(huán)節(jié)會出問題,只要不去 follow,這些環(huán)節(jié)十有八九會出問題。
解析完這三大觀點,下面是我對大數(shù)據(jù)理論的一些疑惑。大數(shù)據(jù)是目前風行的反饋經(jīng)濟中的重要一環(huán),在金融、互聯(lián)網(wǎng)行業(yè)的應用最為廣泛,而這些行業(yè)都是大家所認為的高薪領(lǐng)域。很多時候我就在想,所謂無形的手所產(chǎn)生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數(shù)人跟風,自然就生造出購物節(jié),至于合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。
1 數(shù)據(jù)獨裁。個人意志將受制于集體意志,個人的自由在哪里?用大數(shù)據(jù)預測來懲罰人的行為又確定的違反了無罪推定的原理。
2 所有數(shù)據(jù)都來源于過去,大數(shù)據(jù)分析出來的確定性結(jié)果是否意味著我們在重復過去?拉普拉斯的決定論已經(jīng)被認為是錯誤的,愛因斯坦也說過“上帝不會跟宇宙玩骰子”,但霍金不同意這句話。
【《大數(shù)據(jù)時代》讀后感心得字以上】相關(guān)文章:
《簡愛》讀后感2000字以上04-30
圍城讀后感1000字以上09-20
朝花夕拾讀后感300字以上07-18
水滸傳讀后感200字以上05-11
西游記讀后感500字以上09-27
水滸傳讀后感500字以上09-06
老人與海讀后感800字以上10-11
關(guān)于雪的作文600字以上08-24
我的家鄉(xiāng)作文350字以上07-12
《親情》優(yōu)秀作文1200字以上05-15