身為數(shù)據(jù)科學(xué)家怎么能不掌握這四大技能!
數(shù)據(jù)嚙合是需要在相同的粒度級(jí)別上進(jìn)行的。一種理解的方式是:將一塊大拼圖與由許多小塊數(shù)據(jù)拼圖組成的大拼圖組合起來。
例如,假如給你提供了醫(yī)療保單、信用卡和社區(qū)犯罪率的數(shù)據(jù),想由此找出這些社會(huì)經(jīng)濟(jì)因素如何影響病人,你會(huì)怎樣處理?一些數(shù)據(jù)可能是以人為單位,而另一些數(shù)據(jù)可能是街道或城市級(jí)別,而且沒有明確的方式來關(guān)聯(lián)這些數(shù)據(jù)集。最好的處理方式是什么?這成為了一個(gè)不能忽視且必須被解決的問題。
對(duì)項(xiàng)目進(jìn)行優(yōu)先排序
作為數(shù)據(jù)科學(xué)家,你需要知道如何解釋可能不劃算的項(xiàng)目的投資回報(bào)率(ROI)。這與良好的直接溝通有關(guān)(我們的團(tuán)隊(duì)永遠(yuǎn)不會(huì)停止討論如何溝通),也與能夠清楚表達(dá)價(jià)值并且對(duì)長短期目標(biāo)進(jìn)行優(yōu)先排序有關(guān)(重申一遍,說起來容易做起來難)
團(tuán)隊(duì)總是會(huì)有超出他們處理能力的過多的項(xiàng)目和項(xiàng)目要求。有經(jīng)驗(yàn)的團(tuán)隊(duì)成員需要起帶頭作用來幫助決策者決定哪些項(xiàng)目是值得進(jìn)行的。在有很大機(jī)會(huì)成功但可能不會(huì)有最高投資回報(bào)率的短期項(xiàng)目和很有可能會(huì)失敗但同時(shí)也會(huì)產(chǎn)生較大投資回報(bào)率的長期項(xiàng)目之間需要有一個(gè)良好的平衡。
這種情況下,決策矩陣會(huì)有助于簡化過程。
經(jīng)典的決策矩陣之一是一個(gè)2*2矩陣,行和列分別為重要性和緊迫性。多數(shù)的大學(xué)商業(yè)課程中都會(huì)出現(xiàn)這種矩陣,它很簡單,這也是它很棒的原因。
我曾在公司和一些很聰明的人共事,但還是工作中的每個(gè)項(xiàng)目都被列為優(yōu)先。如果你沒聽過這個(gè)說法,我會(huì)在這里講出來:
如果每件事都被優(yōu)先考慮,那么,相當(dāng)于沒有事情被排在優(yōu)先。
選擇正確的項(xiàng)目意味著必須做出取舍。不是所有的事情都是高優(yōu)的。
許多公司都存在這個(gè)問題,這就是為什么對(duì)于數(shù)據(jù)科學(xué)家團(tuán)隊(duì)中有經(jīng)驗(yàn)的成員,能夠清晰表達(dá)出哪些項(xiàng)目需要當(dāng)下執(zhí)行還是以后執(zhí)行是非常重要的。而使用這個(gè)簡單的矩陣能帶來一定幫助。
(簡潔十分重要,使用矩陣來明確投資回報(bào)率是有幫助的)。
有了簡明直接的溝通,項(xiàng)目繼續(xù)向前推進(jìn),信任也隨之建立起來了。
能夠開發(fā)出穩(wěn)健且最優(yōu)的系統(tǒng)
做出能在受控環(huán)境中操作的算法或模型是一回事。將穩(wěn)健模型集成到實(shí)時(shí)且能處理大量數(shù)據(jù)的系統(tǒng)又是另一回事。根據(jù)公司的不同,有時(shí)數(shù)據(jù)科學(xué)家只需開發(fā)算法本身,之后開發(fā)人員或機(jī)器學(xué)習(xí)工程師會(huì)負(fù)責(zé)將其轉(zhuǎn)為上線的產(chǎn)品。
然而還會(huì)有其他的情況,小的公司和小的團(tuán)隊(duì)可能會(huì)需要數(shù)據(jù)科學(xué)家團(tuán)隊(duì)來將代碼轉(zhuǎn)為上線產(chǎn)品。這意味著算法需要能以合理的速度控制數(shù)據(jù)流量。如果算法要運(yùn)行三個(gè)小時(shí)并且需要被實(shí)時(shí)訪問,這顯然不能在產(chǎn)品上使用。因此,良好的系統(tǒng)設(shè)計(jì)及優(yōu)化是必要的。
隨著數(shù)據(jù)增多,越來越多的人會(huì)與系統(tǒng)交互,模型跟上腳步是十分重要的。
當(dāng)高級(jí)數(shù)據(jù)專家的技術(shù)能力和其他能力相結(jié)合時(shí),才能對(duì)他們自身和其公司產(chǎn)生最大的影響。數(shù)據(jù)科學(xué)家寶貴的經(jīng)驗(yàn)是非常有價(jià)值的,這些經(jīng)驗(yàn)?zāi)軌蛑笇?dǎo)年輕的開發(fā)人員做出更好的設(shè)計(jì)決策,幫助管理者找出哪些項(xiàng)目會(huì)帶來最好的投資回報(bào)率,從而也放大了他們的參與對(duì)于團(tuán)隊(duì)的影響。
責(zé)任編輯:任我行
-
別錯(cuò)過這張AI商用清單:你的生產(chǎn)難題可能被一個(gè)應(yīng)用解決
-
區(qū)塊鏈主流共識(shí)算法的淺析
-
對(duì)于培訓(xùn)出身的同學(xué),接下來該怎么學(xué)習(xí)技術(shù)?
-
別錯(cuò)過這張AI商用清單:你的生產(chǎn)難題可能被一個(gè)應(yīng)用解決
-
區(qū)塊鏈主流共識(shí)算法的淺析
-
對(duì)于培訓(xùn)出身的同學(xué),接下來該怎么學(xué)習(xí)技術(shù)?