隨著大數據時代的到來,數據背后潛藏著巨大的商業機會不僅是大公司的專利,專注于數據挖掘和數據服務的創業公司更是不可小覷的新興力量。
大數據是近兩年來爆發的最熱門IT概念之一。進入2012年,這個領域的風潮逐漸從專業IT人士和數據分析師,擴散到所有關注科技、互聯網以及營銷領域的人群中,甚至還包括政界人士。這種背景下,在商業、經濟及其他領域中,決策行為將日益基于數據和分析而作出,而并非基于經驗和直覺;而在公共衛生、經濟預測等領域中,“大數據”的預見能力也已經嶄露頭角。
數據背后潛藏著巨大的商業機會。以前只有Google、微軟這樣的公司能做大數據的深挖,現在已經有越來越多的創業公司進入,不同公司在不同層面的數據分析和服務領域正創造出新的商業模式。這些專注于數據挖掘和數據服務的公司將成為電子商務乃至互聯網第三方服務業中的新興力量。
對于IT廠商來說,這是一個自身從傳統IT產品跨越到商業智能的絕佳機會;而對有志于這個領域的新型創業者來說,更是一個不可錯過的新興機會。以2012年的趨勢看,有六個模式值得關注:基于Hadoop的分析工具和產品、數據收集再加工服務、數據可視化產品、社交媒體數據分析工具與方案、基于數據挖掘的商業智能與情報咨詢服務。
基于Hadoop的分析工具和產品
越來越多企業開始使用Hadoop平臺處理大量數據。基于Hadoop做面向開發者的分析工具集,或者直接面向企業IT部門的分析管理工具,越來越成為一種流行趨勢。
很多傳統的數據庫管理系統開始整合Hadoop服務,以便更好地為企業服務,如惠普、戴爾、甲骨文、IBM等知名公司都分別有針對自家需求的Hadoop服務。此外,云端上的Hadoop服務讓大數據分析和處理更加方便快捷。同時這也證明,目前開源的Hadoop相關的技術分析也存在明顯缺乏相應的技術、環境、數據安全以及可行性,而這正是新商機。
Cloudera、Hortonworks和MapR是目前最被看好的“Hadoop三駕馬車”,它們屬于那種“純大數據”公司——核心業務圍繞Hadoop發行版和Hadoop應用展開。由于大數據核心技術Hadoop屬于免費的開源技術,用戶無需付費就可下載使用,所以Hadoop創業公司的盈利模式與Oracle這樣的傳統數據庫巨頭大不相同,它們主要靠提供Hadoop增值產品(軟件授權費)和增值服務掙錢。
目前,規模最大的Hadoop企業當屬Cloudera。簡單來說,Cloudera提供企業直接使用的企業版Hadoop,它開發了自己的工具包,讓通過Hadoop搜索數據變得更加容易。同時,Cloudera還在努力建設更廣泛的合作生態系統,從而讓更多不同應用能使用Hadoop服務。
出身Facebook的創始人Jeff Hammerbacher在創辦Cloudera前就使用Hadoop來分析社交用戶行為,后來他將相應的技術轉移到了Cloudera之中,目前Cloudera獲得了7600萬美元的融資。
Cloudera目前比較受關注的領域是醫療健康行業。簡單來說,Cloudera采用大數據來改善大眾的健康,而整個衛生保健行業也會因為受到大數據的驅動而催生更好的創新和服務。Hammerbacher指出,公司一個重要的客戶就是Explorys Medical。他們通過采集病人數據,從而揭示疾病治療、護理和藥物測試等方面的見解。“我們要處理各種各樣的醫療數據,比如說醫生處方、圖像、醫生筆記等。消費者可以通過分享這些數據而推動醫療行業的變革。”
社交媒體數據
社交媒體所產生的海量非結構化數據一直以來都被作為大數據時代來臨的標志。人們已經承認,隨著像Twittter、Fcacebook等社交網絡媒體的爆發,越來越多的商業活動和信息會受到他們的影響。目前,基于社交媒體的創業公司數不勝數,但從大數據角度進行商務挖掘和營銷戰略的,是最有前景的一類。畢竟,奧巴馬利用大數據在美國大選中獲勝的經典案例也是出自社交媒體分析領域。
另一方面Twitter開放其數據管道Firehose對于社交大數據分析來說無疑是一個晴天大利好。利用Twitter實時數據你幾乎能進行各種數據分析,從奧斯卡電影人氣到美國總統支持率,再到產品用戶滿意度分析,可謂一座不設防的數據大金礦。
但是掘金Twitter“快數據”也對分析系統提出了很高要求,DataSift是少數能吃下Twitter數據的頂級社會化分析工具之一。
DataSift是一個社交數據分析平臺,向企業市場人員提供twitter、Facebook、Youtube、博客、甚至Wikipedia等社交媒體的數據可視化分析技術和服務,監測社交營銷成效,并幫助品牌公司掌握突發新聞的輿論點,并制定有針對性的營銷方案。它甚至創建了一個自己的互聯網規模的關鍵詞過濾系統,能夠快速評估熱門關鍵詞。
另一個優勢是DataSift從Twitter購買了多年的數據同步授權,能夠訪問所有Twitter管道數據,并將子集賣給第三方,主要是企業客戶。目前只有Gnip獲得了同樣的授權。舉個簡單的例子,DataSift可以根據Twitter的數據對兩屆奧運會進行橫向對比,從中了解并分析公眾對當時新聞和事件的反應。DataSift的前景逐漸明朗,現在客戶數已經超過了10000個。DataSift目前已經擁有超過200個客戶,其中不乏財富500強企業,DataSift 的收入主要來自向客戶收取的每月200美元的服務費用。
數據收集在加工服務
數據的商業價值越來越被挖掘,但Hadoop并不能代表一切。一家著名的大數據公司ParAccel則顛覆了Hadoop的神話。ParAccel的CEO Chuck Berger指出,太多創業公司陷入了“大數據=非結構化數據的大數據=Hadoop”的邏輯。除了非結構化數據和半結構化數據以外,結構化數據也在快速增長。
ParAccel在數據領域也是久負名氣的。它們最成功的案例之一是向美國執法機構提供數據分析能力——ParAccel通過了一些渠道獲得不少犯罪數據,并對15000個有犯罪前科的人進行跟蹤,從而向執法機構提供了參考性較高的犯罪預測。所以ParAccel也被成為“犯罪的預言者”。
今年登陸納斯達克的“大數據概念股”Splunk也是這方面的佼佼者。由于Splunk是以MapReduce架構為基礎的軟件,在普通的硬件上安裝Splunk 和Splunk轉發器,就能構成大量字節,形成龐大的系統數據,這個量級可以達到每天數TB并逐漸向PB數量級擴大。而他們的軟件可以為機器生成的海量數據建立索引,將其整理成可以搜索的鏈接。公司們則像使用Google那樣來搜索這些鏈接,用來實時分析消費者行為。
推薦閱讀
威客的英文Witkey是The key of wisdom 的縮寫,是指那些通過互聯網把自己的智慧、知識、能力、經驗轉換成實際收益的人,他們在互聯網上通過解決科學、技術、工作、生活、學習中的問題從而讓知識、智慧、經驗、技能體>>>詳細閱讀
本文標題:大數據創業樣本
地址:http://www.xglongwei.com/a/shuju/20121228/93440.html