2013年1月15日 星期二

後雲端時代 - 資料科學家


前言

繼雲端技術之後,Big Data 則是我們即將要面對的重要議題,而這也是未來各公司企業要面對的挑戰,因為,如何妥善有效的應用這些「Big Data」,並轉換成為真正有利於公司預測未來發展趨勢走向的「資訊」,攸關未來整個公司企業發展的成敗。

然而,「Big Data」雖然是充滿魅力的原石,但面對如此海量的資料,要如何琢磨如此龐大的資料量,讓真正有利於公司企業的核心價值可以從中突顯出來,其實並不容易,因為要面對以下的難題:

  1. 如何存放,與管理「Big Data」?
  2. 如何分析處理「Big Data」?
  3. 分析過後的資料,如何從中找出有利的「關鍵資訊」?

要 同時處理這三大問題,這已經超越一般資訊工程師所可以處理的範疇,原因在於這三大問題不但包含了系統建置、系統操作、資料處理,以及資料分析,其中,資料 分析則是整個處理 Big Data 當中,最關鍵的核心部分,因為這關係是否能夠從處理後的資料當中,解析並理解資料,再從中萃取出有利於企業發展的關鍵資訊,所以,處理 Big Data 的人員,必須要有跨領域的能力,才有辦法挖掘出 Big Data 內隱藏的精髓。

資料科學家是探尋 Big Data 的關鍵

Big Data 的議題逐漸發酵之後,需多研究機構,或是科技公司,都意識到能夠處理、分析 Big Data 的專業人員,也就是所謂的資料科學家(Data Scientist),會是未來炙手可熱的人才。

那何謂資料科學家?整合許多科技界名人的見解,所謂的資料科學家,一般來說會具有以下的特質:

  • 資料科學家是跨領域、整合性的人才,必須同時具備系統建置與管理的能力、程式轉寫與開發的能力、資料探勘的能力,以及資料分析的能力。
  • 對資料有獨特的見解能力,並熟悉企業組織架構與特質,能從分析的資料中,探索並架構出有助於企業未來發展的關鍵資訊
  • 有資料分析的能力,並對於統計或數學等相關領域有深刻理解的專業人員,運用統計分析的方法,能從 Big Data 內探索或解析未來商業或科技發展的趨勢。

所以,簡單來說,資料科學家必須具有純熟的系統建置、管理與操作的技術,具有一定的程式撰寫與資料處理的功力,資料統計處理與量化分析的技巧,最後,還有熟悉企業組織特質的能力,才能成就一位有能力駕馭 Big Data 的資料科學家。

資料科學家是 Big Data 洪流下的熱門職缺

因 應 Big Data 分析的需求,不管企業選擇哪種方式來處理 Big Data,最終,還是需要透過資料科學家來分析這些 Big Data,才能發現並擷取出 Big Data 內的價值,並重新架構與組織分析後資料之間的關係,並依照企業組織的特質,將重新關連後的資料,賦予新的見解,並進而轉化為強化企業競爭能力的關鍵。

一般而言,擁有一種專業能力的人才很多,但是要一口氣擁有資料科學家所需三種專長的人,卻是非常稀少,因為要同時具備三種專長並不容易,況且還需要能洞悉企業組織特質的能力,
這樣才有能力依照企業組織的特質,從資料中架構出對企業組織有利的關鍵資料。

再 來,資料科學家的價值,在於發掘未知問題與趨勢的能力,也就是預知外來的趨勢發展,但現階段大部分的資訊人員,卻是擅長處理已知的問題,對企業組織未來的 發展並沒有明顯實質的幫助,也因此,資料科學家是 Big Data 應用下,最熱門的職缺,卻也是人力需求的最大挑戰,而資料科學家的職缺,從 2011 年開始就極速竄升,成為前十大的熱門職缺,也再次顯示資料科學家的重要性。

另外,國外已經有資料科學家的國際認證考試(CCAH、CCDH,與 CCHSB),這在在顯示國外對於資料科學家的重視與培訓,這對於身處在 Big Data 洪流下的我們,不得不重視資料科學家的的價值與重要性。

資料科學家創造企業價值的實例

有許多企業運用資料科學家的能力,協助企業透過大量資料的分析,而對未來業務發展能更加了解,進而轉變成為企業未來營運的決策而有出色的績效表現,其中,不乏有大家熟悉的國際企業組織,例如全球最大的網路書店,亞馬遜(Amazon), 就是透過 Big Data 的分析,能夠了解,並追蹤顧客買了哪些書,並從資料當中可以知道顧客是如何受到評論,或是促銷訓訊息的影響,甚至還能就資料預測顧客對於哪些類別書籍可能 有興趣,會想閱讀,或是購買,藉由這樣的分析與經營流程,而淘汰了許多傳統的實體書店,成為了最大的網路書店。

已經有愈來愈多企業運用 Big Data 來追求精準行銷。例如歐洲某間銀行最近根據信用卡客戶每一筆的購買行為,從 Big Data 中精確找出 1 萬名客戶,奇妙的是,這 1 萬人在接到銀行的促銷電話時,不會馬上說「不需要」就掛斷電話,而是饒有興致詢問優惠的內容。

又 如美國連鎖百貨 Target 的資料科學家,在耙梳 Big Data 後,定義出採購者只要買了特定的 25 種商品,加總演算就可以精算出她的「懷孕預測指數」,一旦偵測到顧客可能已經懷孕,Target 就會啟動行銷活動,在不同的懷孕階段,寄出孕婦專屬的促銷廣告。

另外,近幾年才進駐台灣的服飾品牌,ZARA ,而能夠成為國際知名的品牌,在於其推翻了傳統服飾從設計到上架出售約需 120 天的慣例,只利用短短 7 天的時間,就可以推出新款的服飾,並上架出售, 創造出快速時尚」的潮流,其成功的關鍵,也是在於善用 Big Data 的分析。

所以,從上面的幾個實例,就可以知道 Big Data 是如何創造出企業優勢的競爭力,而關鍵就在於資料科學家如何從 Big Data 的資料內,擷取、分析,並判斷出哪些是提昇企業未來競爭能力的關鍵。

對於台灣現況來說,資料科學家的人才還非常的缺乏,對於分析與應用 Big Data 的經驗也還不足,面對後雲端時代, Big Data 的洪流之下,資料科學家的人力資源,將會是台灣未來發展 Big Data 應用的最大挑戰。

參考文章

1. 資料科學 Data Science
http://esse_tsyo.blogspot.tw/2012/08/data-analytics-data-science.html

2. 資料科學家
http://esse_tsyo.blogspot.tw/2012/08/data-analytics_4923.html

3. 如何成為一名資料科學家?
http://esse_tsyo.blogspot.tw/2012/09/data-analytics.html

4. 未來「夯」職業:資料科學家
http://www.bnext.com.tw/article/view/cid/0/id/21740

5. 企業最誘人的新職缺 資料科學家!

http://www.30.com.tw/article_content_20926.html

6. 資料科學家是點燃企業資料價值的關鍵
http://www.ithome.com.tw/itadm/article.php?c=76545

7. Hadoop 技能有高度需求
http://www.cio.com.tw/article_in.aspx?aid=704

沒有留言:

張貼留言