Quantcast
Channel: iThome
Viewing all articles
Browse latest Browse all 31362

企業投入資料科學前必懂的事情

$
0
0
碁峯資訊

有越來越多的企業在考慮,它們能否,以及如何能透過其資料和/或其資料科學能力來取得競爭優勢。

數據資料和資料科學能力是(彼此相輔相成的)策略性資產。一間公司在怎樣的條件下,可從這樣的資產獲得競爭優勢呢?首先,該資產必須是對該公司來說有價值的。這點似乎再明白不過,不過請注意,對一家公司來說,資產的價值取決於該公司已做的其他戰略決策。例如在資料科學領域之外,於1990 年代的個人電腦業界,Dell 成功利用網頁系統讓顧客依個人需求及喜好來選擇電腦配備,藉此先行取得顯著競爭優勢,超越業界龍頭Compaq。而Compaq 無法從網頁系統獲得同樣的價值,主要原因之一就是,Dell和Compaq 所實施的策略不同:Dell 已經是一個直接面對顧客的電腦零售商,透過產品型錄銷售;在這種策略之下,網頁系統極具價值。Compaq 則主要透過零售店賣電腦;在這種不同的策略之下,網頁系統並不那麼有價值。當Compaq 嘗試複製Dell 的網頁系統策略時,便面臨到來自其零售商的強烈反彈。所以說,新資產(網頁系統)的價值會取決於各公司的其他戰略決策。

這個例子告訴我們,要在了解業務的階段仔細思考數據資料和資料科學如何能在我們的商業策略下提供價值,以及在競爭對手的策略之下是否也是如此。這能找出可能的商機與可能的威脅。在資料科學領域中,直接對應於Dell 與Compaq 案例的,就是Amazon與Borders。Amazon 的顧客購書資料很早就讓他們能在顧客於網路上購物時,提供個人化的推薦資訊。但即使Borders 也能運用哪些人購買了哪些書的資料,他們的實體零售策略並不允許提供同樣無縫接軌的資料科學式推薦資訊。

因此擁有競爭優勢的先決條件就是,該資產必須在我們的策略之下是有價值的。若我們要取得競爭優勢,競爭對手就必須是不具有該資產的,不然就是無法從該資產獲得同樣的價值。我們應要同時考慮數據資產與資料科學能力。我們是否擁有獨一無二的數據資產?若否,我們所擁有的資產是否更適合運用於我們的策略環境中(與競爭對手的策略環境相比)?或者,我們是否有更好的資料科學能力可更妥善地運用數據資源?

優秀的資料科學家和一般資料科學家的能力差距可能很大,而優秀的資料科學團隊和優秀的單一資料科學家的能力差距也會很大。但如何能夠確實吸引到多位資料科學家呢?怎樣才能建立出優秀的團隊呢?

吸引並培育資料科學家及其團隊

其實這是個非常難回答的問題。在資料科學家的雇用方面,最好的公司是世界各地的IBM、Microsoft 與Google,這些公司透過薪資報酬、津貼福利及/ 或某些無形的東西(例如一種不可輕忽的特定因素──資料科學家喜歡和其他的頂尖資料科學家混在一起),清楚表明了他們對資料科學的價值認定。而有些資料科學家會說,他們之所以需要和其他的頂尖資料科學家混在一起,不只是因為這樣每天工作起來會比較開心,也是因為該領域的涵蓋範圍廣闊,將一群資料科學家的智慧集合起來,就能產生更多不同類型的問題解決技術。

但人才搶手並不表示一切全然無望。很多資料科學家會想擁有更多的個人影響力,而這是他們在企業巨人之下所難以獲得的。很多人都希望在範圍更大的資料科學解決方案生產過程中,承擔更多的責任(同時獲得隨之而來的經驗)。有些人夢想成為某公司的首席科學家,而且他們知道通往首席科學家的路最好是以較小且較多種不同公司的專案鋪設而成。有些人則夢想成為企業家,而且他們知道從新創公司的資料科學家做起能夠獲得寶貴經驗。另外還有一些人就是單純喜歡參與快速成長企業的刺激感:在一家每年成長20% 或50% 的公司裡工作,和在一家每年只成長5% 或10%(或是根本沒成長)的公司裡工作是很不一樣的。

基於這些理由,在雇用資料科學家方面有優勢的,其實是那些創造出環境以培育資料科學與資料科學家的公司。若你的公司在這方面未能達到群聚效應,請發揮創意。鼓勵你的資料科學家參與地區性的資料科學技術社群,以及全球性的資料科學學術團體。

一家公司的資料科學,可透過學術型資料科學家的參與來強化。這部分有幾種做法。例如可針對有興趣了解其理論之實際應用的學者,資助其研究計畫。最理想的安排(依我們的經驗),就是將資料、資金與有趣的商業問題組合起來;若該專案最終將成為頂尖課程中某位學生的博士論文的一部分,那麼對公司的利益便可能遠高於成本。資助一名博士生可能每年需花費5 萬美元,但這是雇用一名全職頂尖資料科學家的好幾分之一。關鍵在於,你要對資料科學有足夠的了解,才能選對合適的教授──所具有的專業知識符合你手邊的問題所需。

而另一種可能非常划算的做法,是找一或多個頂尖資料科學家來做科學顧問。若能將關係處理好,使顧問能夠真正接觸到問題的解決方案,那麼沒有資源或影響力可雇用到最優秀的資料科學家的公司,仍可藉此大幅提高最終解決方案的品質。這樣的資料科學顧問可來自合作夥伴企業、有共通投資者或董事會成員的公司,也可以是有時間提供諮詢的學者。

研究資料科學案例

除了建立一個堅實的資料科學團隊外,管理者如何能確保其公司處於可掌握機會應用資料科學的最佳狀態呢?就是要確保大家對資料科學的基礎原則都有所理解且重視。公司中許多握有某些權限的員工,往往都能發現各種創新應用。

在掌握了資料科學的基礎原則後,邁向成功的最佳辦法,就是研究很多資料科學在商業問題上的應用案例。研讀那些真正經歷過資料採礦程序的案例,規劃出你自己的案例研究。實際的資料採礦很有幫助,但更重要的是去思考商業問題與可能的資料科學解決方案之間的連結。研究過越多不同的問題,你就越能自然而然地看出並利用「貯存」在資料中的資訊與知識來獲利──同樣的問題規劃往往可類比應用於另一問題,只要經過小幅度的修改即可。

在現實中,企業與資料科學團隊都該要準備好面對各式各樣的困境與限制,且必須靈活應變。有時會有很多資料和資料科學技術可運用,但有時情況會比較像電影「阿波羅13 號」中危急的一幕。在該電影裡,指揮艙中的故障與爆炸讓太空人被困在距離地球25 萬英里處,而且二氧化碳濃度的上升過速讓他們可能無法活著回來。簡言之就是,基於太空人所面對的條件限制,工程師們必須想出辦法以大型的立方體濾波器來取代較窄的圓柱型濾波器(就是要把方形的釘子打進圓形的洞裡)。在那關鍵的一幕中,首席工程師將指揮艙裡所有的「東西」都堆在桌上,然後告訴他的團隊:「好了,各位……我們得想辦法把這個裝進這個的洞裡,就只有這些東西可用了。」真實的資料科學問題往往更像是阿波羅13 號的情境,而不是教科書裡的樣子。(摘錄整理自第13章)

資料科學的商業運用(Data Science for Business)

Foster Provost, Tom Fawcett/著;陳亦苓/譯

碁峯資訊出版

售價:680元

 

 

 作者簡介 

Foster Provost

紐約大學史登商學院的教授兼NEC教職研究員,他在該校講授商業分析、資料科學,以及許多MBA課程。其得獎研究廣獲閱讀及引用。

Tom Fawcett

擁有機器學習領域的博士學位,已在業界擔任研發工作超過二十年(GTE實驗室、NYNEX/Verizon的實驗室,以及HP的實驗室等)。


Viewing all articles
Browse latest Browse all 31362

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>