如何系統(tǒng)學(xué)習(xí)數(shù)據(jù)分析?
很多學(xué)習(xí)數(shù)據(jù)分析的同學(xué)也都有這樣一種困惑“為什么學(xué)了那么多工具,還是不會(huì)?”,原因無(wú)外乎兩個(gè),一是只學(xué)到了碎片的知識(shí),沒(méi)有建立知識(shí)之間的連接,無(wú)法形式自己的知識(shí)體系,二是缺乏實(shí)踐,導(dǎo)致無(wú)法形成“知行合一”的工作技能。

知識(shí)超載和碎片化
當(dāng)代人都面臨兩個(gè)問(wèn)題——信息超載和知識(shí)碎片化。
信息超載老話(huà)題不多說(shuō)了,講幾個(gè)數(shù)據(jù):
全世界每天有4000本書(shū)出版,超過(guò)4億個(gè)字;
紐約時(shí)報(bào)一天的文字量等于牛頓同時(shí)代的人一生的閱讀量;
一個(gè)專(zhuān)業(yè)領(lǐng)域,每天大概有200個(gè)公眾號(hào)正在注冊(cè),有近1000篇文字正在產(chǎn)生……
過(guò)去雜家、博物家在現(xiàn)代社會(huì)已經(jīng)不可能存在,即使有,也干不過(guò)谷歌度娘。
結(jié)論1:知識(shí)的儲(chǔ)存能力,人類(lèi)早就被電腦完勝了,知識(shí)的搜索和鏈接能力,才是學(xué)習(xí)的核心競(jìng)爭(zhēng)力。
另一個(gè)趨勢(shì)也很明顯:知識(shí)碎片化。這個(gè)碎片化從3個(gè)方面開(kāi)始——
首先時(shí)間和空間被打碎,移動(dòng)手機(jī)允許你在三站地鐵里聽(tīng)完一本書(shū);
其次被打碎的是信息,如果你翻知乎、今日頭條或者某個(gè)博客,你并不會(huì)像看一本書(shū)一樣,知道前面一章講什么的,后面即將講什么,除了標(biāo)題黨,你根本對(duì)下一個(gè)博客、內(nèi)容毫無(wú)預(yù)期,只能被動(dòng)接受;
最糟糕的其實(shí)是知識(shí)結(jié)構(gòu)碎片化——你并不知道是誰(shuí),在什么情況下,針對(duì)什么問(wèn)題講的這句話(huà)。所有的信息缺乏了上下文,就是廢話(huà)。
比如說(shuō)有段時(shí)間我刷管理類(lèi)的文,你會(huì)發(fā)現(xiàn)在雷軍、傅盛、彼得德魯克、吳伯凡、馬云、吳曉波……各位大佬針對(duì)同一個(gè)問(wèn)題講的內(nèi)容完全不同。到底信哪個(gè)?其實(shí)雷軍講的是互聯(lián)網(wǎng)行業(yè);傅盛講的是小企業(yè)逆襲,他正在做投資;彼得德魯克用管理在講哲學(xué);吳伯凡老師在講中西方文化;馬云老師在對(duì)大眾勵(lì)志;吳曉波其實(shí)是用管理談財(cái)經(jīng)——更重要的是,他們講話(huà)的場(chǎng)合,時(shí)間點(diǎn)和對(duì)象你一無(wú)所知。
結(jié)論2如果一個(gè)人沒(méi)有搜索能力,他不會(huì)知道背景;沒(méi)有思考能力,不會(huì)知道為什么——這樣單純知道一句話(huà),比不知道更糟糕。
把前面兩個(gè)結(jié)論放一塊,結(jié)果很清晰——時(shí)間空間碎片化確實(shí)能夠提高學(xué)習(xí)的效率(其實(shí)也干不過(guò)電腦),而信息碎片化和知識(shí)結(jié)構(gòu)碎片化帶來(lái)的,則是學(xué)習(xí)效率的倒退和焦慮之源——因?yàn)樗麣У裟愕?strong>主動(dòng)搜索能力和主動(dòng)鏈接的能力,也就是深度思考的能力。
這就是碎片化的陷阱,極大的提高了并沒(méi)有什么卵用的信息,而降低了最重要的獨(dú)立思考的能力。
知識(shí)可以零售嗎?
最近的問(wèn)答類(lèi)APP非?;?,先是知乎4月份在其微信公眾號(hào)悄然上線(xiàn)了【值乎】,而后果殼網(wǎng)在5月份不甘示弱,上線(xiàn)了【分答】并且后來(lái)居上,用戶(hù)活躍一下子超越了【值乎】。
【分答】是一款付費(fèi)語(yǔ)音問(wèn)答產(chǎn)品,它的規(guī)則非常簡(jiǎn)單,有三種角色設(shè)定:回答者、提問(wèn)者、偷聽(tīng)者?;卮鹫咧恍枵f(shuō)明自己擅長(zhǎng)的領(lǐng)域,然后設(shè)置付費(fèi)問(wèn)答的價(jià)格,價(jià)格規(guī)定在1-500元之間,感興趣的用戶(hù)可以作為提問(wèn)者付費(fèi)后對(duì)回答者進(jìn)行<=50字的文字提問(wèn),然后回答者通過(guò)<=60s的語(yǔ)音來(lái)回答問(wèn)題。在此過(guò)程中,其他用戶(hù)可以作為偷聽(tīng)者通過(guò)1元的付費(fèi)來(lái)“偷聽(tīng)”回答者的語(yǔ)音回答。被“偷聽(tīng)”一次,提問(wèn)者和回答者可以各得0.5元。
【分答】吸引人的地方有兩個(gè),一個(gè)是提問(wèn)和回答能賺錢(qián),讓知識(shí)不再是免費(fèi)的分享,真正做到了書(shū)中自有黃金屋;一個(gè)是明星效應(yīng),或者說(shuō)是網(wǎng)紅效應(yīng)。【分答】一開(kāi)始能夠點(diǎn)爆市場(chǎng),看它的卡司就知道了。
有亞洲首富之子同時(shí)也是國(guó)民老公的王思聰,有各類(lèi)綜藝大咖如《最強(qiáng)大腦》的帥氣教授魏坤琳、《奇葩說(shuō)》第一季冠軍馬薇薇、《邏輯思維》創(chuàng)始人羅振宇等,還有演藝界的明星佟大為、汪峰等,這樣強(qiáng)大的陣容,讓【分答】在上線(xiàn)20幾天的時(shí)候,就拿到一億美金的估值,而國(guó)民老公王思聰,僅僅回答了25個(gè)問(wèn)題,短短的25分鐘時(shí)間,就賺了11萬(wàn)多。
在一片喧囂,全民歡騰過(guò)后,靜下心想一想,以“知識(shí)的零售平臺(tái)”為目的的【分答】一類(lèi)的問(wèn)答社區(qū),真的能達(dá)到傳播知識(shí),提升能力的效果?
如果說(shuō)【知乎】的一問(wèn)多答,干貨至上的模式,收獲的是多角度的價(jià)值觀(guān)、人生觀(guān)以及知識(shí)體系;【果殼】的科技報(bào)道,收獲的是科技的不為人知的小細(xì)節(jié),是滄海遺珠。那么【分答】一類(lèi)的60s的語(yǔ)音回答,收獲的或許只是跟明星的親密接觸,以及搞一個(gè)大新聞賺錢(qián)的欲望的滿(mǎn)足。為什么這么說(shuō)呢?
-
首先,對(duì)于答題者來(lái)說(shuō),60s的時(shí)間僅足夠講1、2個(gè)笑話(huà),對(duì)于一個(gè)知識(shí)點(diǎn)來(lái)說(shuō)根本不足以講透,所以這60s的回答不是用來(lái)提供知識(shí)的;
-
其次,對(duì)于提問(wèn)者來(lái)說(shuō),提問(wèn)字?jǐn)?shù)限制在50個(gè)字以?xún)?nèi),提問(wèn)的東西只能非常直接,根本無(wú)暇顧及問(wèn)題的背景。因此在【分答】上經(jīng)常出現(xiàn)以下的問(wèn)題: 如果非要二選一做你的女朋友,你選XXX還是XXX,為啥? 你和XXX的性福生活是真是假? 你多久啪啪啪一次,最近的一次啪啪啪是什么時(shí)候和誰(shuí)?
-
最后,對(duì)于提問(wèn)者來(lái)說(shuō),提問(wèn)的目的不再是單純的希望獲得知識(shí),而是想獲得更多的人偷聽(tīng),從而達(dá)到賺錢(qián)的目的,這樣的目的,不利于知識(shí)的正向分享。
知道哪些知識(shí)重要比學(xué)習(xí)知識(shí)更重要
我們都有這樣的經(jīng)歷,在上學(xué)的時(shí)候,準(zhǔn)確而準(zhǔn)時(shí)地劃重點(diǎn)的老師會(huì)往往被同學(xué)們點(diǎn)贊。曾幾何時(shí),劃重點(diǎn)成為課堂最激動(dòng)人心和最令人期待的一刻。在信息爆炸時(shí)代,尤其如此,最重要的不是增加信息,而是篩選和刪除信息。
系統(tǒng)學(xué)習(xí)的重要性
任何學(xué)習(xí)知識(shí),都是相互聯(lián)系,相互作用的。因此第一步就是找出各部分間的直接聯(lián)系,把網(wǎng)絡(luò)結(jié)構(gòu)初步地建立起來(lái)。但是有些部分和其他部分并不一定能夠建立直接的聯(lián)系,那么還需要發(fā)掘第二層、第三層關(guān)系。 要明確各部分之間的關(guān)系,以及綜合運(yùn)用。 學(xué)習(xí)是先模糊概括,再逐漸在大框架下逐步明晰細(xì)節(jié)、完善結(jié)構(gòu)、針對(duì)缺陷和不足專(zhuān)攻的學(xué)習(xí)方法。
行動(dòng)學(xué)習(xí)理論認(rèn)為,人要掌握一門(mén)技能,需要有10%的時(shí)間學(xué)習(xí)知識(shí)和信息,70%的時(shí)間練習(xí)和踐行,還有20%的時(shí)間與人溝通和討論。這個(gè)原則叫做721原則。
碎片化學(xué)習(xí)對(duì)于10%的信息接收非常有用,而剩下獨(dú)處練習(xí)的70%和討論的20%,則需要留出大量時(shí)間來(lái)系統(tǒng)學(xué)習(xí)——碎片化學(xué)習(xí)永遠(yuǎn)只是系統(tǒng)化學(xué)習(xí)的輔助。你需要留出足夠多整塊時(shí)間學(xué)習(xí)。
所謂系統(tǒng)學(xué)習(xí)法,是指把所學(xué)內(nèi)容當(dāng)成是一個(gè)系統(tǒng)看待,力求從大方向出發(fā)指導(dǎo)學(xué)習(xí),這樣,在學(xué)習(xí)的時(shí)候不是按部就班按章節(jié)行進(jìn),而是先模糊概括,再逐漸在大框架下逐步明晰細(xì)節(jié)、完善結(jié)構(gòu)、針對(duì)缺陷和不足專(zhuān)攻的學(xué)習(xí)方法。
如何系統(tǒng)學(xué)習(xí)數(shù)據(jù)分析?
在學(xué)習(xí)數(shù)據(jù)分析之前應(yīng)該明白幾點(diǎn)
數(shù)據(jù)初期的準(zhǔn)備通常占整個(gè)數(shù)據(jù)挖掘項(xiàng)目工作量的70%左右。
數(shù)據(jù)分析師本身融合了業(yè)務(wù)知識(shí)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)等學(xué)科,并不是新的技術(shù)。
數(shù)據(jù)分析更適合業(yè)務(wù)人員學(xué)習(xí)(相比技術(shù)人員學(xué)習(xí)業(yè)務(wù)來(lái)的更高效)
數(shù)據(jù)分析項(xiàng)目通常需要重復(fù)一些毫無(wú)技術(shù)含量的工作。
職業(yè)規(guī)劃
以數(shù)據(jù)分析師為例,先看一下國(guó)內(nèi)知名互聯(lián)網(wǎng)數(shù)據(jù)分析師的招聘要求:
計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專(zhuān)業(yè)本科及以上學(xué)歷;
具有深厚的統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘知識(shí),熟悉數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的相關(guān)技術(shù),能夠熟練地使用SQL;
三年以上具有海量數(shù)據(jù)挖掘、分析相關(guān)項(xiàng)目實(shí)施的工作經(jīng)驗(yàn),參與過(guò)較完整的數(shù)據(jù)采集、整理、分析和建模工作;
對(duì)商業(yè)和業(yè)務(wù)邏輯敏感,熟悉傳統(tǒng)行業(yè)數(shù)據(jù)挖掘背景、了解市場(chǎng)特點(diǎn)及用戶(hù)需求,有互聯(lián)網(wǎng)相關(guān)行業(yè)背景,有網(wǎng)站用戶(hù)行為研究和文本挖掘經(jīng)驗(yàn)尤佳;
具備良好的邏輯分析能力、組織溝通能力和團(tuán)隊(duì)精神;
富有創(chuàng)新精神,充滿(mǎn)激情,樂(lè)于接受挑戰(zhàn)
前三個(gè)屬于硬件要求,一般而言,有專(zhuān)業(yè)基礎(chǔ)(計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專(zhuān)業(yè))入行需要3個(gè)月以上的學(xué)習(xí)。對(duì)于非專(zhuān)業(yè)背景的同學(xué),入行的時(shí)間可能需要的更長(zhǎng),建議給自己預(yù)留6-12月的時(shí)間。而要成為一個(gè)熟手(企業(yè)用工需求最多)則需要2-3年以上的行業(yè)經(jīng)驗(yàn)。
Anyway,作為一門(mén)對(duì)數(shù)學(xué)和計(jì)算機(jī)都有較高要求的一門(mén)交叉學(xué)科,從事大數(shù)據(jù)是有一定門(mén)檻的,但相對(duì)于10年以上的職業(yè)生涯(國(guó)外頂尖數(shù)據(jù)科學(xué)家50-60歲仍然十分活躍),預(yù)備半年的時(shí)間來(lái)學(xué)習(xí)這個(gè)最炙手可熱的技能還是很劃算的。
從業(yè)務(wù)開(kāi)始
學(xué)習(xí)一門(mén)技術(shù)要和行業(yè)靠攏,沒(méi)有行業(yè)背景的技術(shù)如空中樓閣。技術(shù)尤其是計(jì)算機(jī)領(lǐng)域的技術(shù)發(fā)展是寬泛且快速更替的(十年前做網(wǎng)頁(yè)設(shè)計(jì)都能成立公司),一般人沒(méi)有這個(gè)精力和時(shí)間全方位的掌握所有技術(shù)細(xì)節(jié)。但是技術(shù)在結(jié)合行業(yè)之后就能夠獨(dú)當(dāng)一面了,一方面有利于抓住用戶(hù)痛點(diǎn)和剛性需求,另一方面能夠累計(jì)行業(yè)經(jīng)驗(yàn),使用互聯(lián)網(wǎng)思維跨界讓你更容易取得成功。不要在學(xué)習(xí)技術(shù)時(shí)想要面面俱到,這樣會(huì)失去你的核心競(jìng)爭(zhēng)力。
大數(shù)據(jù)是技術(shù)工具,最終的應(yīng)用需要深入理解業(yè)務(wù)企業(yè)的業(yè)務(wù)場(chǎng)景和商業(yè)模式,甚至有人說(shuō)不懂業(yè)務(wù)就不要談大數(shù)據(jù),可見(jiàn)領(lǐng)域知識(shí)的重要性。值得一提的是,近幾年在頂尖科學(xué)雜志《Nature》與《Science》上發(fā)表的大數(shù)據(jù)文章都是來(lái)自行業(yè)專(zhuān)家,而并非計(jì)算機(jī)專(zhuān)家,這從另外一個(gè)方面反映了業(yè)務(wù)知識(shí)的重要性。
get技能
數(shù)學(xué)知識(shí)
數(shù)學(xué)知識(shí)是數(shù)據(jù)分析師的基礎(chǔ)知識(shí)。對(duì)于初級(jí)數(shù)據(jù)分析師,了解一些描述統(tǒng)計(jì)相關(guān)的基礎(chǔ)內(nèi)容,有一定的公式計(jì)算能力即可,了解常用統(tǒng)計(jì)模型算法則是加分。對(duì)于高級(jí)數(shù)據(jù)分析師,統(tǒng)計(jì)模型相關(guān)知識(shí)是必備能力,線(xiàn)性代數(shù)(主要是矩陣計(jì)算相關(guān)知識(shí))最好也有一定的了解。
分析工具
對(duì)于初級(jí)數(shù)據(jù)分析師,玩轉(zhuǎn)Excel是必須的,數(shù)據(jù)透視表和公式使用必須熟練,VBA是加分。另外,還要學(xué)會(huì)一個(gè)統(tǒng)計(jì)分析工具,SPSS作為入門(mén)是比較好的。對(duì)于高級(jí)數(shù)據(jù)分析師,使用分析工具是核心能力, SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
編程語(yǔ)言
對(duì)于初級(jí)數(shù)據(jù)分析師,會(huì)寫(xiě)SQL查詢(xún),有需要的話(huà)寫(xiě)寫(xiě)Hadoop和Hive查詢(xún),基本就OK了。對(duì)于高級(jí)數(shù)據(jù)分析師,除了SQL以外,學(xué)習(xí)Python是很有必要的,用來(lái)獲取和處理數(shù)據(jù)都是事半功倍。當(dāng)然其他編程語(yǔ)言也是可以的。
勤于學(xué)習(xí)
大數(shù)據(jù)時(shí)代的知識(shí),沒(méi)有像印刷時(shí)代對(duì)知識(shí)結(jié)構(gòu)視為必須具備的“基礎(chǔ)”知識(shí),知識(shí)是非線(xiàn)性的,可以自由組合、切割,處于一種分散和游離的狀態(tài)。未來(lái),你必須具備快速自學(xué)和捕捉知識(shí)的能力,學(xué)習(xí)將從一個(gè)“知識(shí)儲(chǔ)備,學(xué)以致用”的過(guò)程,向“知識(shí)構(gòu)建,用時(shí)再學(xué)”的過(guò)程轉(zhuǎn)變,學(xué)習(xí)將是一個(gè)持續(xù)的,乃至終身學(xué)習(xí)的過(guò)程。為此你需要具備一種快速而靈活的學(xué)習(xí)方式。
參與一次系統(tǒng)培訓(xùn):
系統(tǒng)培訓(xùn)能夠幫你規(guī)劃并實(shí)施一個(gè)系統(tǒng)的學(xué)習(xí)方案,會(huì)在你起步的時(shí)候構(gòu)建一個(gè)比較扎實(shí)的基礎(chǔ)知識(shí)框架,這個(gè)過(guò)程和蓋樓時(shí)先打地基的道理是一樣的,地基打的越深,樓房才能蓋的越高。具備項(xiàng)目經(jīng)驗(yàn)的講師會(huì)講授很多實(shí)際工作中的項(xiàng)目經(jīng)驗(yàn),可以帶領(lǐng)大家快速進(jìn)入正確的學(xué)習(xí)通道,少走彎路。當(dāng)然,培訓(xùn)取代不了工作實(shí)踐,如前所述,多在工作中積累業(yè)務(wù)經(jīng)驗(yàn),技能水平才能提升的更快。
在社區(qū)快速學(xué)習(xí):
在國(guó)外,除了大學(xué),社區(qū)形式的學(xué)習(xí)平臺(tái)(如r4stats.com、KNIME)由于知識(shí)更新快,學(xué)習(xí)時(shí)間更加靈活,形成了獨(dú)特的社區(qū)學(xué)習(xí)(community learning)現(xiàn)象。社區(qū)里不但有初學(xué)者(freshman),也是不少頂尖技術(shù)專(zhuān)家(Veteran)光顧的地方。社區(qū)是一個(gè)自由、無(wú)中心的交流學(xué)習(xí)平臺(tái),沒(méi)有權(quán)威,一切都可以質(zhì)疑和挑戰(zhàn)。當(dāng)然,如果要和這些高手過(guò)招,你必須先打好英語(yǔ)基礎(chǔ)。未來(lái),社區(qū)將成為從業(yè)者技能get、快速充電的重要渠道,社區(qū)或?qū)⒊蔀槔^高等學(xué)校、職業(yè)學(xué)校以外的一個(gè)“無(wú)圍墻”的校園。
詳情請(qǐng)咨詢(xún)!
客服熱線(xiàn):023-66090381