首頁 > CIO > 正文

如何培養數據思維

2020-03-17 09:25:22  來源:CIO之家

摘要:不管是做PPT還是看新聞,人們潛意識里,有了數據支撐更容易讓對方信服,但是,數據也是會騙人的,如果不懂得數據思維,在大數據時代很容易被數據迷昏了眼。
關鍵詞: CIO
   統計學是什么,就是收集、處理、分析、解釋數據并從數據中得出結論的科學。生活中的我們時時刻刻都在接觸各種各樣的數據。淘寶看你日常瀏覽記錄,給你推薦你可能喜歡的衣服,抖音算法記錄你最喜歡看什么視頻,然后不斷地推送給你同類型的短視頻。甚至可以這么說,你在網絡上,就是一串數據構成的。
 
  不管是做PPT還是看新聞,人們潛意識里,有了數據支撐更容易讓對方信服,但是,數據也是會騙人的,如果不懂得數據思維,在大數據時代很容易被數據迷昏了眼。
 
  舉個例子,人們通常會誤將相關性等同于因果關系。在很多心理學教科書上會談及到一個問題:為什么冰淇淋的銷售量和溺水死亡率成正比。
 
  如果用因果關系看這個問題,那么就成了因為冰淇淋銷量越高人們溺水死亡率就越高。這難道是冰淇淋對人們游泳造成傷害了嗎?
 
  如果用相關性來看,冰淇淋銷量上升代表著天氣越來越熱,所以出門有用的人也越來越多。所以才會出現溺水人數上升的情況。很多文章會用具有相似性的兩對關系用因果關系來吸人眼球。如果你沒有一些基礎的數據思維,就很容易聽信了作者的胡言亂語。
 
  所以,在大數據時代,數據思維已成了每個人的必備品。
 
  下面,我們就來了解一下,什么是數據思維。
 
  什么是數據思維?
 
  要想弄懂什么是數據思維,首先來打破大家對數據的錯誤認知,數據不僅僅指數字。
 
  百度百科對數據的定義是這樣的:數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號。它不僅指狹義上的數字,還可以是具有一定意義的文字、字母、數字符號的組合、圖形、圖像、視頻、音頻等,也是客觀事物的屬性、數量、位置及其相互關系的抽象表示。
 
  簡單理解一下,數據包括數字、圖片、視頻、音頻等。不是說分析數字就是分析數據,你即便分析100張圖片,那也算分析數據。總得來說,我們無時無刻都處在數據分析的世界。你要分析公司的運營數據,你要分析網絡上對于疫情的數據統計,在淘寶中,我們也在做分析。
 
  那么數據思維是什么呢?
 
  現代教學理論指出,數據分析能力由數據認知能力、數據收集能力、數據整理能力、數據表述能力及數據探究能力構成。
 
  用大白話講,數據思維就是你能對數據進行挖掘、分析,從數據中發現價值的能力。
 
  人要學的能力有這么多,為什么偏偏要學習數據思維?
 
  學會數據思維的好處:
 
  一、 提高溝通效率
 
  溝通不是靠嘴嗎,怎么還要靠數據了?在當今社會,人們要么因為數據相信你的話,要么因為相信你。數據是真實的代表。
 
  《事實》中說道:如果你想要真正地說服某人他的觀念是錯誤的,那么最有效的方法就是能夠用數據來測試他們的觀念。
 
  工作中最需要用到數據進行溝通的,就是PPT。要想你的觀點能夠被甲方同意,首先得拿出說服他的證據。數據就是最好的武器,通過你對數據的解讀,讓甲方心中有了落地感,不至于顯得太空洞。
 
  數據本身,并不能變成人們的認知。
 
  數據和數據的解釋密不可分,單純的一個“9”,能夠代表的意義太多了,那么我們就要對這個數據進行解釋。數據思維在其中的作用就是為了和不懂數據的人建立起溝通的橋梁。經過你的思維方式,將數據進行轉化成能夠被對方接受的信息。
 
  二、理性看待世界
 
  大多數情況下,我們都用的是直線思維思考問題做事情。直線思維是指:我們的本能會假設所有事情都是按照直線規律來發展的。
 
  比如說,渴了就喝水,感冒了就吃感冒藥一樣。絕大多數的工作都要我們用到直線思維,吧簡單、方便、見效快。但是,直線思維也有它無法適用的地方。你想要加薪,直線思維就會推動你去老板辦公室談薪資。那加薪成功率就指不定有多高了。
 
  《事實》里還有一句話:當我們對另外一件事情不夠熟悉的時候,我們將很容易假設它是按照直線發展的,而忘了考慮這種假設很可能是愚蠢的。
 
  比如新加坡疫情。我之前關注過新加坡疫情,新加坡感染人數在全球第三的情況下還出現了萬人宴的情況,政府也宣傳健康人無需戴口罩。在我看來,這不就是胡鬧嗎?新冠肺炎生存能力很強,即使摸到門把手也有被感染的可能性,更何況出現了和武漢類似的萬人宴。這可是多么大的危險存在。
 
  于是我預言,新加坡后面的疫情一定不會明朗。沒想到過了將近半個月,新加坡的疫情增速非常低,從數據中就能知道新加坡管控十分得當。后來我想了想,我并沒有真正了解過新加坡政府的防御措施,為什么建議正常人無需戴口罩,發現新館肺炎病人又是如何處理的,社區內如何進行消毒等等。
 
  無知會帶來盲目自信,你以為你以為就是你以為的,殊不知,你才了解到了冰山一角。
 
  數據思維就是為了警惕自己的直線思維,避免只看到一部分事實就妄下斷論,用理性去看待世界,而不是憑著自己的直覺。網上的數據那么多,真假還需靠自己分辨,對一切事物抱著懷疑的態度,除非找到數據能夠證明觀念正確,否則就不要輕易被別人的觀點帶偏。
 
  在數據思維中,有一個定量分析方法論,定量分析是依據數據展開,所以使用定量分析能夠降低決策風險,而且大多數專業數據分析師直到現在都還在使用定量分析來幫助公司分析數據做決策。在《數據分析師》這本書中,作者讓非專業數據分析師也能夠學會如何做一個簡單的數據分析。
 
  那么定量分析該如何進行呢?
 
  定量分析的六大步驟:
 
  一、 識別問題
 
  充分理解問題是什么以及這個問題為什么重要。
 
  《黑客帝國》中有句臺詞這樣說:也許我們根本就問錯了問題。
 
  搞清楚問題是什么是解決問題的開始。是什么代表著未來該如何解決問題的方向,手段等等,如果一開始就問錯了,那么你將在錯的路上做了無用功,吃力不討好。
 
  比如我問朋友,為什么我這么沒用?這個問題問出來大概也就自己能夠明白為什么吧。沒用還能繼續往下分,在哪方面沒用,是因為不擅長,還是不愿意做好,還是自己拖延?我們要問出關鍵的問題。
 
  問答類的解謎游戲中,最重要的就是問出關鍵問題。關鍵問題找到后,事情的推進就快了很多,同樣,解決辦法也浮出水面。
 
  所以,你要清楚的描述,自己要解決的問題是什么。在這里,可以用上“WHY假設模型”來推導你真正需要問的關鍵性問題。
 
  “WHY假設模型”簡單的來說就是做假設,假設造成這種結果的原因。拿文章舉例,大的問題是:為什么我的文章變現能力差?
 
  假設1:標題不夠吸引人→原因:沒有引起共鳴、沒有引起讀者的好奇心、對讀者來說沒有價值。
 
  假設2:內容對讀者來說沒有用→原因:內容表述過于生硬、內容對讀者來說沒有新鮮感、內容開頭不吸引人、結尾引導轉化效率不高。
 
  假設3:內容與平臺調性不符→我的內容過于干貨,不適合這個平臺。
 
  做假設是為了提前做預判,那么你問的關鍵問題就藏在你的眾多假設中。你的問題就不僅僅是寬泛的該如何實現文章變現,而是針對文章某個具體位置做突擊。
 
  二、 回顧之前的發現
 
  選擇一條正確的路比找到一條正確的路要簡單得多。同理,我們解決問題也應當如此。大概率情況下,你遇到過的問題,一定有人遇到并且解決過。所以,你即將要走的彎路,別人已經幫你走過了,別人找到的解決辦法的套路,也幫你試驗過了。
 
  而且,回顧之前的發現,也是在做對比和創新。通過回顧以前的案例,你更可能了解什么樣的數據更重要,前人失敗和成功的原因在哪里,什么問題是最關鍵的。
 
  《成為數據分析師》中說:你的問題不像你像的那樣特殊,并且你正打算做的工作,有許多前人可能已經做過了。不要被費力氣做所謂的重復性勞動,你所需要做的是搜索、搜索、再搜索。
 
  比如說你要做一個關于中秋節的活動策劃,網上肯定有很多成功的中秋節活動方案供你參考,如果你只靠自己去想活動創意的話,可能花費一天時間,你想到的是別人已經做過的活動。而且,問做活動有經驗的同事,是不錯的選擇。他能告訴你一個活動的創意可以從什么地方去找,做活動需要注意什么問題。就像你準備做旅游攻略,最巧妙的辦法就是找去玩過的人詢問經驗。
 
  三、選擇變量
 
  變量就是那些影響你做判斷的因素。比如你想要養一只貓,那么你要考慮的變量包括日常貓糧開銷、我是否擁有養育好貓的責任心、是否對養貓有一定了解、能否一個人承擔養貓的重任……
 
  影響一件事情的變量有很多,但不是每個都那么重要。變量也遵循著二八定律,著重關注重要的20%變量,簡化掉所有非必須和無關緊要的細節,關注重要變量才不至于迷失方向。這就需要你在最開頭識別問題中發現關鍵問題,同時也可以通過對原因做假設,找到那些重要的變量。
 
  四、收集數據
 
  數據是分析的基石,沒有適合做分析的數據,就做不出好的決定。
 
  NBA休斯頓火箭隊總經理是職業籃球中最具分析性思維的管理者,他認為:真正的優勢來源于與眾不同的數據。
 
  搜索數據最重要的是耐心,再加上一些搜索技巧,就能夠事半功倍。如果一開始不知道如何搜索,可以采取廣泛搜索的方式,即通過百度、谷歌、360搜索引擎去搜索。
 
  在搜索過程中你對問題就有了大致的方向,順藤摸瓜,去各大專業網站找資料。科技相關的就找36氪、創業邦、新浪科技等網站,找娛樂相關的就去新浪微博、豆瓣、公眾號等。還有很多報告網站有著大量的數據。對每個網站屬性特質把握好,什么網站擁有你想要的數據,減少在其他頁面搜索浪費時間。
 
  五、 分析數據
 
  《成為數據分析師》:數據分析需要找到恒定的模式;換言之,就是蘊含在數據中的變量之間的關系。
 
  在專業的數據分析師分析時,他們會采用專業的分析模型進行分析,針對不同變量采取不同的分析模型,直方圖、相關系數、協方差、各種概率分布、抽樣與動態模擬、總體均值判斷,均值推斷、線性、非線性回歸、多元回歸分析、移動平均等內容。大多都能夠在excel表格中根據模型進行數據分析。掌握數據模型并不是多難的事,重點在于我們分析數據時要用到的思維方法。
 
  在分析數據時,可以用上以下6種比較簡單但使用范圍很廣的分析思維。
 
  ①對比思維
 
  對比也分縱向和橫向。比如說一個人今天稱是100斤,縱向即時間上的對比來看,在半年里。這是她最瘦的體重,這里的橫向就是和她身高差不多,性別相同的人做對比,她已經算是很苗條了。
 
  對比思維隨處可見,通過對比才能知道這到底出于什么水平。
 
  ②細分思維
 
  一個app的下載量有這么多,那么用戶是通過各種各樣的渠道下載的。通過細分渠道下載量,你就能知道什么方向投放廣告可以預算再多點,什么方向投放廣告在做無用功。
 
  你的目標需要細分,你的任務也能夠細分,就連現在的職業都被細分成不止360行。細分的目的就在于將大問題切割成不同的小問題,麥肯錫著名的MECE方法本質上也運用了細分思維,它將 一個重大的議題,能夠做到不重疊、不遺漏的分類,做到“相互獨立,完全窮盡”。
 
  ③溯源思維
 
  有時候數據表面并沒有辦法透露真相,你需要從數據產生的源頭出發。一份2019年度人民健康報告由一家名氣不怎么大,而且還是民營公司發表,那么報告上面的數據就有待參考。
 
  有很多公眾號她們會關注用戶是通過什么渠道知道公眾號的,比如將近20%的用戶都是通過書上的二維碼才關注了這個公眾號,那么就可以去分析為什么這個渠道有這么多關注量,是因為書賣得好,還是什么文案引導了用戶關注。
 
  ④相關思維
 
  相關性不等于因果關系。冰淇淋銷量上升的同時,溺水死亡人數也在上升,顯然易見,冰淇淋和溺水一定不會是因果關系,所以,我們就要考慮到相關性。冰淇淋銷量上升,是因為天氣越來越熱,所以,游泳人數也在上升,因此,冰淇淋銷量和溺水死亡人數呈正相關,但不像一元方程:y=x這樣的因果關系。
 
  ⑤假設思維
 
  如果你對于數據和結論沒有頭緒,可以先做假設,就像我們一開始用到的“WHY假設模型”,先做假設,然后用你掌握的數據驗證假設是否成立。
 
  比如你看這組數據和其他數據可能有關系,但是腦子里又沒有一個清晰的思路,不如根據想法來先作出假設,假設數據是因為某事件才產生聯系,有了聯動效應,然后反復驗證,繼續做假設,再繼續驗證。
 
  ⑥逆向思維
 
  有時候我們用直線思維思考問題思考了很久就會走入死胡同。腦筋急轉彎就需要你用逆向思維解決問題。1911年,倫敦舉辦了一個“吹塵器”的表演,這個機器是這么操作的,將塵土吹起,然后將塵土收入到容器中。后來,有一個設計師反過來想,為什么不能是吸塵呢?于是,吸塵器就產生了。
 
  逆向思維不一定能夠獲得正確答案,但是能讓走進死胡同的你拽到一條新的大道上,啟發思考。
 
  六、 傳達結果并基于行動
 
  斯蒂芬·菲爾德說:只要你為數字提供清晰、服眾的展現方式,數字可以告訴我們很重要的信息。
 
  在向別人展現數據分析的結果時,可以采用結論先行的方式。
 
  在《金字塔原理》中關于結論先行的作用做這樣的描述:如果作者傳達給讀者的思想已經實現進行了歸類和概括,并且按自上而下的順序呈現,讀者就能更容易理解作者表達的思想。
 
  結論先行的方式能夠先讓聽眾明白你要講述的觀點是什么,在你接下來的論述過程中能夠順著你的思路來,更容易記住你的觀點和接受。
 
  打個比方。在匯報你的分析結果時,先拋出最終的分析結果即你的觀點:我認為我們應該多增加在抖音上的投放廣告……然后,再開始分析為什么你得出了這個結論。
 
  數據如何展現也是非常重要的。一張數據圖做的再好看都不如直接更有用。什么樣的數據適用于什么樣的圖表類型,餅圖、曲線圖、表格等等,數據說明中又該放什么數據進去。數據支撐是為了證明你的證據,如何布置數據的標準就是能否說服對方。
 
  這六大步驟,數據分析并不是最重要的,是每一環都不可缺少,相輔相成,缺一不可。有一部分沒做到位,這一個決策閉環就得從頭再來一遍。
 
  講了這么多分析數據的方法,最重要的是要培養自己的數據思維,思維決定最終的效果。在日常生活中,多注意以下幾點情況,數據思維就會在腦子里生根發芽。
 
  在生活中該如何去培養自己的數據思維呢?
 
  首先,不要害怕看見數據。我的大學專業不用學習數學,導致我現在只要看到密密麻麻的數字,我都想直接忽略不計,劃過直接看到結論。沒有經過自己對數據的分析就會遵從了作者的結論,這很容易失去對事情的思考能力。所以,當你看到數據的時候,先別想著略過,不如靜下來仔細看看,或許能發現數據之間神奇的事情。
 
  疫情期間,正是有網友發現武漢紅十字會的數據出現嚴重出入,然后引發了一連串的事件。任何數據的出現都是有原因的。
 
  其次,懷疑數據。數據最容易騙人,因為人們也足夠相信數據。如果有人拿2010年的數據告訴你,某某行業趨勢十分良好啊,根本不用擔心失業。過時的數據值得令人懷疑是否還具有參考作用。
 
  相信我們都聽說過聽莫扎特音樂能夠提升智力這樣的話,為了證明正確,還會搬出科學家的研究成果。在《看不見的大猩猩》這本書中介紹了有關莫扎特音樂的研究成果。
 
  很多科學家都做過證明莫扎特音樂能夠提升智力的實驗,有證明成功的,也有證明無效的。證明成功的那些科學家都出自同門,同一個老師的手下。其他的科學家復制實驗方法,結果依然無法證明莫扎特音樂能夠提升智力。
 
  “在實驗科學領域,如果某一實驗結果只能被某一人成功操作或只能出現在某一實驗室,就有理由懷疑這個實驗結果本身。”
 
  所以,數據都能造假,憑什么相信他的真實性呢?要學會懷疑數據來源,數據是如何產生的,即使是人統計的數據,都有出錯的可能。
 
  最后,保持好奇心。保持好奇心說來簡單,但是也不容易。凡事多問一句“為什么”,為什么她們的分析結果是這樣的,這些數據又是從何而來,如果是我自己,我從這些數據中又能夠得到什么結論呢?
 
  哈佛大學校長陸登庭在“世界著名大學校長論壇”上所說:“如果沒有好奇心和純粹的求知欲為動力,就不可能產生那些對人類和社會具有巨大價值的發明創造。”雖然我們不至于要像發明家一樣創造,保持好奇心其實是一種成長型思維,擁有求知欲,不斷用外界的知識來補充自己。
 
  總結一下,用數據思維做理性決策時要經歷六大步驟:識別問題、回顧之前的發現、選擇變量、搜集數據、分析數據、傳達結果并采取行動。生活中如果想要養成數據思維,首先不要逃避數據,最重要的是保持對數據的懷疑,還要擁有一顆好奇的心。

第三十屆CIO班招生
法國布雷斯特商學院碩士班招生
北達軟EXIN網絡空間與IT安全基礎認證培訓
北達軟EXIN DevOps Professional認證培訓
責編:wangxu
江苏七位数预测号码