海量資料將成企業標準配備(2013-09-23 14:10:57 先探投資週刊│鄭威宏)

凡走過必留下痕跡,同時也留下大量商機,在美國,海量資料應用已撲天蓋地而來,大到打總統選戰,小到擠牛奶,未來公司要在產業站穩腳步,海量資料處理已從「選配到標配」,預估產業每年以六成的速度高速增長。


【文/鄭威宏】

著名新月派現代詩人徐志摩留下膾炙人口的新詩-再別康橋,新詩中「悄悄的我走了,正如我悄悄的來;我揮一揮衣袖,不帶走一片雲彩」,營造出那番寂然無聲沉靜味道。如果回到現代社會,可能這種飄逸感就打上不小折扣。當今,作詩寫稿也已不再使用紙張,人類的行為模式開始由實體轉向虛擬(電腦或雲端硬碟),也因為如此,不帶走一片雲彩也只好改成「凡走過必留下痕跡」。

到處都是走過的痕跡

事實上,凡走過必留下痕跡,這其實就是BIG DATA(海量資料)時代來臨的一項特徵。近年來,隨著3G智慧型手機的普及(4G隨侍在後)、電子商務的盛行、社群網路的大行其道、雲端伺服器應用增加等因素使然,一來增加消費者對於網路世界的黏著度,二來消費者的使用頻率及高品質檔案傳輸環境成熟,大幅提高網路上的資料傳輸量。

據IBM一○年底統計,亞馬遜每秒的訂單數量達七二.九筆、每家戶每天的資料使用量三七五MB、全球使用者在臉書每月的使用已達七○○○億分鐘以上、谷歌每天處理的資料量達二四PB(1024 Trillionbyte)、移動數據每日的流量達一.三EB(一○二四PB)等,這些都是使用者留下的痕跡。但在過去,由於處理技術上的不足,如此大批的資料庫卻苦無用武之地,最後因使用頻率太低,或是儲存成本壓力,只好捨去。

不過,○三至○四年間,由谷歌發表兩篇論文「The Google File System、MapReduce : Simplified Data Processing on Large Cluster」開始,敘述谷歌如何利用MapReduce演算法來計算查詢索引,讓使用者能在最短時間從網際網路上取得自已所需查詢的資料,讓海量資料處理開始浮上檯面,也是海量資料最早的應用之一。

海量資料處理能力翻數倍

爾後,Doug Cutting(又被稱為Hadoop之父)參考上述谷歌二篇論文為藍圖,演變成一套如何儲存、處理、分析TB至PB等級的資料處理方法︱Hadoop。Hadoop是一個免費且開放原始碼的分散式檔案系統,可以用於各種不同電腦之間,總和成為單一電腦系統進行平行運算,不僅全球最快的運算系統,也是當今海量資料處理最主要的基礎架構,就如同一般消費者筆電中的Windows作業系統。

而且,Hadoop更可怕的不只是能處理一TB以上的海量型資料,此外,過去的資料處理領域多為局限在結構化資料(指資料經過分析後可分解成多個互相關聯的組成部分,各組成部分間有明確的層次結構);但Hadoop還能加入非結構化資料的分析能力,像是log記錄檔、照片、聲音、通訊記錄或是電子郵件等,過去不易、不被且昂貴的儲存、處理、分析的資料,現在都得到解決。
過去而言,結構化資料約占資料量的一五%,但半非結構化資料卻高達八五%,也就是說,有了Hadoop的出現,不但能讓現有的資料處理能力以倍數增加,而且,這種半 非結構化的資料就像一個新發現的礦山,處處充滿商機,更是讓海量資料威力發揮得更淋漓盡致。

比方來說,如果消費者要去實體商店消費,服務認真一點的店家會記錄消費者的最終消費紀錄,未來有新品,或是店家以直覺的提供相關產品的試用等,但消費者走向虛擬店家(電子商務)後,不僅是最終的消費紀錄,像是曾在網頁上點擊過什麼樣的產品、停留時間、購物順序等都會被記錄下來,不僅能提供給下一個同性質的客群添購上的推薦參考,而且,別人的消費選擇也會再次回饋,以便同一位消費者再次光臨。

近期最夯的例子是美國最大線上影片出租服務公司Netflix(NFLX.US),在使用海量資料分析後,網站推薦給客戶的影片中,十部有七.五部會被消費者採用,大大減少行銷成本外,還增加Netflix與客戶間的黏著度。此外,更神奇的是,由於Netflix已先將影片的導演、明星組合、影片劇情元素等資料經由演算及分析過,當使用者看完影片,要對影片下評價前,Netflix已預測出使用者會給怎樣的評等,充分滿足客戶需求,難怪Netflix股價從去年中的五○美元,漲至目前超過二五○美金。

租片、牛乳、總統選戰

而且,海量資料不僅可應用在虛擬經濟上,實體經濟同樣受惠。先前彭博新聞曾報導,一家牛乳農場將擠奶機器置上資料儲存系統,記錄每頭乳牛長期分泌牛乳的資料,並找到最佳化的擠奶策略;並且,透過這些非結構資料,還能知道乳牛是否健康,是否感染乳腺炎,大大增加採乳量及農場運作效率。

另外,去年美國總統大選時,歐巴馬競選團隊也使用海量資料來進行選戰分析,發現選民喜歡競賽、小型宴會及名人加持等元素,而且,由於海量資料的取得及解讀,可以準確了解某族群或是某地區對於歐巴馬的支持度,因而可以採取相關的應對措施,成為歐巴馬贏得選戰的秘密武器。

不論是虛擬或是實體的世界,海量資料的應用已經是越來越普及,不再是谷歌、雅虎搜尋引擎業者的專利。近年來,已明確使用海量資料分析的國際級知名企業,像是臉書、IBM、紐約時報、豐田、三星、微軟等都已先後採用,可預見的,未來行銷及營運策略面向的針對性將大為不同,具有分析及使用海量資料的企業,相較之下競爭力勢必大幅提升,也讓企業提高架設海量資料平台的意願。

因此,可以預見海量資料市場勢必將快速擴大,根據Wikibon研調資料指出,預估在二○一六年底時,全球海量資料處理市場將成長至五三四億美元,較去年底時,市場整整成長超過十倍,換算成年複合成長率高達五九.九%,可說是超快速成長的市場,一點也不遜於雲端市場的成長速度。

軟體、硬體、服務三天下

回過頭來,海量資料市場商機為何?首先理所當然就是通路或是品牌業者,未來包括產品設計、廣告行銷都會越來越精準;另外,電子商務業者未來有了海量資料處理的幫助,對於客戶經驗及行為模式的掌握也就更高,對於實體商店也將形成無形壓力。

而若將商機角度轉至海量資料「處理」上,可分為軟、硬體及技術服務三大塊市場,就Wikibon統計,軟硬體分別占市場約為二五及三一%商機,而技術服務市場則高達四四%,為單一最大營收來源區塊。

軟體服務方面,Hadoop作為系統軟體,延伸出的應用軟體,目前國際上規模較大的業者,包括致力於提供靈活的BI(商業智慧)產品,提供混合搜索引擎和分析引擎,為商業決策供給協助的Oracle Endeca(曾幫豐田妥善處理產品召回事宜,及為HOMEDEPOT成功提高營運周轉率),或是致力於監測和分析非結構化資料,重點監測後並即時分析客戶體驗,幫助企業提高用戶黏性的Splunk(Vodafone曾使用Splunk產品來提升客戶服務效率,順利達成降低客戶流失的目的)。

硬體方面,海量資料技術架構Hadoop是一個全新系統平台,就是因為是全新的平台,技術人才形成很大的障礙,目前需取得四張的專業證照,不論在國際或是國內,能自建海量資料處理平台的公司相當少(除非像是擁有大量軟體工程師的公司,如阿里巴巴),也使像是IBM等公司在銷售Hadoop平台時,多已包裹整台伺服器銷售,對於伺服器市場的銷售也將起正面幫助。

另外,對於一般公司而言,如果要開始建立海量資料處理能力,勢必增加伺服器的使用,加上海量資料隱含使用者、資料讀取量都會大幅增加,對於ADC(application delivery controllers)使用機率的就大為增加,尤其中國市場自從3G市場快速發展後,F-安瑞長線營運將值得期侍,另外,同樣在海量數據增加對於營運有明顯幫助的立端,也是受惠的廠商。

服務的方面,由於使用海量資料處理的產業包括金融、醫療、電子商務、電信,甚至是汽車、電子、家電等終端消費型市場,但相對而言,不少公司在IT人員配置上較缺乏,加上懂得使用Hadoop業者IT又更是少數,因此海量資料處理的服務市場相對大上許多,像是國內的精誠,不僅擁有Splunk研究室支援,也是國內最早且唯一切入海量資料處理的系統整合商,人力資源最為豐富,目前更打敗IBM、華為等國際業者,成為中國最大電信業︱中移動的海量資料處理合作業者,營運開始顯現成果;加上採取租賃及服務的營運模式,長線受惠於海量資料處理商機,將以累積式的成長,值得期待。

回列表頁
其他相關文章
5月看盤重點指引 人氣股熱線追蹤( 先探投資週刊│方亞申)
股價腰斬後的航運股能買嗎?( 先探投資週刊│黃俊超)
七月營收 航運、車用股飆速( 先探投資週刊│黃俊超)
報價拐點浮現 鋼鐵人重出江湖( 先探投資週刊│黃俊超)

加密貨幣
比特幣BTC 64495.15 218.25 0.34%
以太幣ETH 3159.34 19.53 0.62%
瑞波幣XRP 0.528888 0.00 0.28%
比特幣現金BCH 479.19 0.17 0.04%
萊特幣LTC 84.33 1.17 1.40%
卡達幣ADA 0.472777 0.00 -0.45%
波場幣TRX 0.117018 0.00 3.35%
恆星幣XLM 0.114100 0.00 -0.32%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。