時常聽創(chuàng)業(yè)者說自己的公司每天會生產(chǎn)/記錄很多的數(shù)據(jù),雖然他們暫時還沒想明白怎么用這些數(shù)據(jù),但把這些數(shù)據(jù)都先存起來了。他們經(jīng)常還說,通過這些數(shù)據(jù)他們的產(chǎn)品/服務將得到很大的提升,仿佛這些數(shù)據(jù)就是公司的救世主一樣。本文不想討論這種觀點正確與否,但想在這里解釋兩個關于大數(shù)據(jù)的常見誤解:
一、數(shù)據(jù)不等于信息
經(jīng)常有人把數(shù)據(jù)和信息當作同義詞來用。其實不然,數(shù)據(jù)指的是一個原始的數(shù)據(jù)點(無論是通過數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更能不能代表信息就會成比例增多。我們來看兩個簡單的例子:
備份。很多人如今已經(jīng)會定期的對自己的硬盤進行備份。這個沒什么好多解釋的,每次備份都會創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。
多個社交網(wǎng)站上的信息。我們當中的很多人在多個社交網(wǎng)站上活躍,隨著我們上的社交網(wǎng)站越多,我們獲得的數(shù)據(jù)就會成比例的增多,我們獲得的信息雖然也會增多,但卻不會成比例的增多。不單單因為我們會互相轉(zhuǎn)發(fā)好友的微博(或者其他社交網(wǎng)站上的內(nèi)容),更因為很多內(nèi)容會十分類似,有些微博雖然具體文字不同,但表達的內(nèi)容十分相似。
二、信息不等于智慧(Insight)
好吧,現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足以下三個標準:
可破譯性。這可能是個大數(shù)據(jù)時代特有的問題,越來越多的企業(yè)每天都會生產(chǎn)出大量的數(shù)據(jù),卻還沒想好怎么用,因此,他們就將這些數(shù)據(jù)暫時非結構化(unstructured)的存儲起來。這些非結構化的數(shù)據(jù)卻不一定可破譯。比如說,你記錄了某客戶在你網(wǎng)站上三次翻頁的時間間隔:3秒,2秒,17秒,卻忘記標注這三個時間到底代表了什么,這些數(shù)據(jù)是信息(非重復性),卻不可破譯,因此不可能成為智慧。
關聯(lián)性。我們曾經(jīng)對關聯(lián)性的重要性進行過解釋。這里不再贅述了,無關的信息,至多只是噪音。
新穎性。這個和我前文舉的那個社交網(wǎng)站的例子類似,不同的是,這里的新穎性很多時候無法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進行判斷。舉個例子,某電子商務公司通過一組數(shù)據(jù)/信息,分析出了客戶愿意為當天送貨的產(chǎn)品多支付10塊錢,然后又通過另一組完全獨立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。
大數(shù)據(jù)時代來襲
那么大數(shù)據(jù)到底有什么用?到底會帶來怎樣的變化呢?
隨著社交網(wǎng)絡、云服務、網(wǎng)上購物、數(shù)字閱讀等各種新的線上消費和生活模式的流行和普及,可以預見的是人們和互聯(lián)網(wǎng)之間的聯(lián)系程度在將來越來越緊密。
用戶和消費者的消費習慣、興趣愛好、關系網(wǎng)絡以及整個互聯(lián)網(wǎng)的趨勢、潮流都將成為互聯(lián)網(wǎng)從業(yè)者關注的重點和熱點,而這一切的獲取和分析都離不開大數(shù)據(jù)。
所以,所謂的大數(shù)據(jù)意味著一種新的信息建構模式和商業(yè)模式,意味著數(shù)據(jù)背后往往就潛藏著商業(yè)利益和經(jīng)濟增長點,意味著凌亂紛繁的數(shù)據(jù)背后就是更符合用戶興趣和習慣的產(chǎn)品和服務,意味著廠商可以更好地自己的產(chǎn)品和服務進行針對性地調(diào)整和優(yōu)化。
所以,IBM才會以超過140億美元的代價在過去收購大量與數(shù)據(jù)處理和分析有關的企業(yè),而惠普也會在2011年以67億英鎊收購Autonomy,而Google也不遺余力地先后收購數(shù)據(jù)分析公司Record Future和Postrank。
由于大數(shù)據(jù)所需要的非常的技術和經(jīng)濟背景,它往往是和微軟、Google、Facebook以及IBM這樣的大公司聯(lián)系在一起的,但是這并不意味著大數(shù)據(jù)就和我們的日常生活沒有關系,事實上,大數(shù)據(jù)已經(jīng)滲入到我們生活的方方面面,從方方面面影響、改變著我們的生活。
隨之而來的問題就是,大數(shù)據(jù)究竟和我們的生活有怎樣的關系?
當我們每次用Google進行搜索,在Gmail中出現(xiàn)的關鍵字;iPhone用戶和Siri互動所產(chǎn)生的所有信息都會被蘋果公司收集并進行整理分析;Facebook一直對用戶信息進行著收集。甚至連NFL、NBA和奧運會等各種體育賽事中都已經(jīng)開始熟稔地運用大數(shù)據(jù)對球員和球隊進行分析。
盡管國內(nèi)的大數(shù)據(jù)起步晚而且發(fā)展遲緩,但如阿里巴巴、淘寶等也同樣對平臺上的用戶數(shù)據(jù)進行著收集和整理。
現(xiàn)在大數(shù)據(jù)所形成的市場規(guī)模在51億美元左右,而到2017年此數(shù)據(jù)預計會上漲到530億美元。
實際上我們就已經(jīng)和大數(shù)據(jù)發(fā)生里密不可分的關系,生活中各種各樣的大數(shù)據(jù)應用一方面使得用戶體驗不斷被優(yōu)化,另一方面又使得各種應用者從中尋找到新的商機。
大數(shù)據(jù)時代已經(jīng)來臨,大數(shù)據(jù)的海洋正波濤洶涌地涌向人們,那么諸位那么準備好乘風破浪迎接大數(shù)據(jù)的洗禮了嗎?
大數(shù)據(jù)已成紅海?!全球十四個大數(shù)據(jù)公司全面盤點!
在本文中,我整理了當今世界上在大數(shù)據(jù)領域最具話語權的企業(yè),它們有的是計算機或者互聯(lián)網(wǎng)領域的巨頭,有的是剛剛創(chuàng)辦不久的初創(chuàng)企業(yè)。但它們有一個共同點,那就是它們都看到了大數(shù)據(jù)帶來的大機會于是毫不猶豫地挺進了這個領域。
雖然大數(shù)據(jù)是比云計算還要新興的一個術語,但是通過我在這篇文章里列舉的一些公司你就可以發(fā)現(xiàn),在此領域已有很多外國企業(yè)深耕已久,但是國內(nèi)企業(yè)在這個領域還幾乎是空白。
傳統(tǒng)巨頭:
企業(yè)名稱:IBM
網(wǎng)址:http://www.ibm.com/
上線時間:2011年5月
公司地址:美國紐約州阿蒙克市
融資狀況:IBM業(yè)務
業(yè)務方向:主要面向大企業(yè)等市場
IBM這個藍色巨人現(xiàn)如今雖已經(jīng)沒有上世紀名號響亮,但是在如今企業(yè)市場的各個領域卻具有無可爭議的話語權,自然它也不會放過大數(shù)據(jù)這塊肥肉,現(xiàn)在它是全球最大的信息技術和業(yè)務解決方案公司。
2011 年5月,IBM正式推出InfoSphere大數(shù)據(jù)分析平臺。InfoSphere大數(shù)據(jù)分析平臺包括 BigInsights和Streams,二者互補,Biglnsights基于Hadoop,對大規(guī)模的靜態(tài)數(shù)據(jù)進行分析,它提供多節(jié)點的分布式計算,可以隨時增加節(jié)點,提升數(shù)據(jù)處理能力。Streams采用內(nèi)存計算方式分析實時數(shù)據(jù)。InfoSphere大數(shù)據(jù)分析平臺還集成了數(shù)據(jù)倉庫、數(shù)據(jù)庫、數(shù)據(jù)集成、業(yè)務流程管理等組件。
企業(yè)名稱:亞馬遜
網(wǎng)址:http://www.amazon.com/
上線時間:2009年
公司地址:美國華盛頓州西雅圖
融資狀況:亞馬遜業(yè)務
業(yè)務方向:主要面向大企業(yè)等市場
對于云計算和大數(shù)據(jù),亞馬遜絕對具有先見之明,早在2009年就推出了亞馬遜彈性MapReduce(Amazon Elastic MapReduce),亞馬遜對Hadoop的需求和應用可謂了若指掌,無論是中小型企業(yè)還是大型組織。彈性MapReduce是一項能夠迅速擴展的 Web服務,運行在亞馬遜彈性計算云(Amazon EC2)和亞馬遜簡單存儲服務(Amazon S3)上。這可是貨真價實的云:面對數(shù)據(jù)密集型任務,比如互聯(lián)網(wǎng)索引、數(shù)據(jù)挖掘、日志文件分析、機器學習、金融分析、科學模擬和生物信息學研究,用戶需要多大容量,立即就能配置到多大容量。
除了數(shù)據(jù)處理外,用戶還可以使用Karmasphere Analyst的基于服務的版本,Karmasphere Analyst是一種可視化工作區(qū),用于在亞馬遜彈性MapReduce上分析數(shù)據(jù)。用戶還可以提取結果文件,以便在數(shù)據(jù)庫或者微軟Excel或 Tableau等工具中使用。
企業(yè)名稱:甲骨文
網(wǎng)址:http://www.oracle.com/
上線時間:2010年
公司地址:美國加州紅木城
融資狀況:甲骨文業(yè)務
業(yè)務方向:主要面向大企業(yè)等市場
甲骨文在近期發(fā)布的Oracle大數(shù)據(jù)機(Oracle Big Data Appliance)為許多企業(yè)提供了一種處理海量非結構化數(shù)據(jù)的方法。在2011年10月初召開的Oracle OpenWorld 2011大會上甲骨文正式推出了Oracle大數(shù)據(jù)機。對于那些正在尋求以更高效的方法來采集、組織和分析海量非結構化數(shù)據(jù)的企業(yè)而言,該產(chǎn)品具有很大的吸引力。
與甲骨文近期推出的其他一體化產(chǎn)品一樣,Oracle大數(shù)據(jù)機集成了硬件、存儲和軟件,包括Apache Hadoop軟件的開源代碼分發(fā)、新的甲骨文NoSQL數(shù)據(jù)庫和用于統(tǒng)計分析的R語言開源代碼分發(fā)。該產(chǎn)品被設計為能夠與甲骨文Database 11g、Oracle Exadata數(shù)據(jù)庫云服務器,以及針對商業(yè)智能應用的新的Oracle Exalytics商業(yè)智能云服務器一起協(xié)同工作。
企業(yè)名稱:谷歌
網(wǎng)址:http://www.google.com/
上線時間:2011年
公司地址:美國加州山景城
融資狀況:谷歌業(yè)務
業(yè)務方向:面向各類企業(yè)市場
谷歌一直是科技行業(yè)的領軍者,近年來幾乎在任何一項互聯(lián)網(wǎng)科技項目你都能看到谷歌的身影,大數(shù)據(jù)時代谷歌自然不會錯過。何況如果對其擁有的海量數(shù)據(jù)進行深入挖掘,這對于提升谷歌搜索乃至所有谷歌服務的價值無可估量。
BigQuery 是Google推出的一項Web服務,用來在云端處理大數(shù)據(jù)。該服務讓開發(fā)者可以使用Google的架構來運行SQL語句對超級大的數(shù)據(jù)庫進行操作。 BigQuery允許用戶上傳他們的超大量數(shù)據(jù)并通過其直接進行交互式分析,從而不必投資建立自己的數(shù)據(jù)中心。Google曾表示BigQuery引擎可 以快速掃描高達70TB未經(jīng)壓縮處理的數(shù)據(jù),并且可馬上得到分析結果。大數(shù)據(jù)在云端模型具備很多優(yōu)勢,BigQuery服務無需組織提供或建立數(shù)據(jù)倉庫。而BigQuery在安全性和數(shù)據(jù)備份服務也相當完善。
去年底該服務只向一小部分開發(fā)者開放,現(xiàn)在任何人都可以注冊這項服務。免費帳號可以讓你每月訪問高達100GB的數(shù)據(jù),你也可以付費使用額外查詢和存儲空間。
企業(yè)名稱:微軟
網(wǎng)址:http://www.microsoft.com/
上線時間:2011年
公司地址:美國華盛頓州雷德蒙市
融資狀況:微軟業(yè)務
業(yè)務方向:面向各類企業(yè)市場
微軟研究部門從2006年起就一直致力于某種非常類似于Hadoop的項目,被稱為“Dryad”。今年年初,該計劃通過與SQL Server和Windows Azure云的集成實現(xiàn)了Dryad的產(chǎn)品化。雖然現(xiàn)在微軟還沒有更新,但看上去Dryad似乎將成為在SQL Server平臺上影響大數(shù)據(jù)愛好者的有力競爭者。
微軟進入這一市場可謂“姍姍來遲”,而且在一定程度上說,數(shù)據(jù)倉庫分析和內(nèi)存分析計算市場落下了后腿。2011年初微軟發(fā)布的SQL Server R2 Parallel Data Warehouse(PDW,并行數(shù)據(jù)倉庫),PDW使用了大規(guī)模并行處理來支持高擴展性,它可以幫助客戶擴展部署數(shù)百TB級別數(shù)據(jù)的分析解決方案。微軟目前已經(jīng)開始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區(qū)技術預覽版本的連接器。 該連接器是雙向的,你可以在Hadoop和微軟數(shù)據(jù)庫服務器之間向前或者向后遷移數(shù)據(jù)。
微軟在去年推出了基于Azure云平臺的測試版 Hadoop服務,今年它承諾會推出與Windows兼容的基于Hadoop的大數(shù)據(jù)解決方案(Big Data Solution),這是微軟SQL Server 2012版本(首發(fā)日期還不知道)的一部分,現(xiàn)在也不清楚微軟是否會與其他硬件合作伙伴或者相關大數(shù)據(jù)設備廠商合作。
企業(yè)名稱:EMC
網(wǎng)址:http://www.emc.com/
上線時間:不詳
公司地址:美國麻州Hopkinton市
融資狀況:EMC業(yè)務
業(yè)務方向:面向各類企業(yè)市場
EMC 于1979年成立于美國麻州Hopkinton市,1989年開始進入企業(yè)數(shù)據(jù)儲存市場。 EMC公司是全球信息存儲及管理產(chǎn)品、服務和解決方案方面的領先公司。EMC是每一種主要計算平臺的信息存儲標準,而且,世界上最重要信息中的 2/3 以上都是通過EMC的解決方案管理的。
面對大數(shù)據(jù)時代,EMC公司推出用于支持大數(shù)據(jù)分析的下一代平臺――EMC Greenplum統(tǒng)一分析平臺(UAP)。Greenplum UAP是一個唯一的統(tǒng)一數(shù)據(jù)分析平臺,可擴展至其他工具,其獨特之處在于,它將對大數(shù)據(jù)的認知和分享貫穿整個分析過程,實現(xiàn)比以往更高的商業(yè)價值。
企業(yè)名稱:Teradata
網(wǎng)址:http://www.teradata.com/
上線時間:2011年
公司地址:美國俄亥俄州邁阿密斯堡
融資狀況:Teradata業(yè)務
業(yè)務方向:面向各類企業(yè)市場
Teradata 公司(Teradata Corporation,紐約證券交易所交易代碼TDC)是全球領先的數(shù)據(jù)倉庫,大數(shù)據(jù)分析和整合營銷管理解決方案供應商,專注于數(shù)據(jù)庫軟件,數(shù)據(jù)倉庫專用平臺及企業(yè)分析方案。 不久前宣布推出一款集硬件、軟件和服務于一體的全面產(chǎn)品組合——Teradata分析生態(tài)系統(tǒng) (Teradata Analytical Ecosystem),使不同的 Teradata 系統(tǒng)實現(xiàn)無縫協(xié)作,為企業(yè)客戶提供分析和更深入的洞察力,幫助其預測商業(yè)機會和加速實現(xiàn)商業(yè)價值。Teradata Unity 將確保整個Teradata Analytical Ecosystem的同步和統(tǒng)一。為了增強在大數(shù)據(jù)分析領域的優(yōu)勢, Teradata還收購Aster Data公司,以增強其非傳統(tǒng)數(shù)據(jù)分析的能力,突破了SQL分析的限制,協(xié)助企業(yè)從全部數(shù)據(jù)中獲取更多價值。
企業(yè)名稱:NetApp
網(wǎng)址:http://www.netapp.com
上線時間:2011年
公司地址:美國加利福尼亞州森尼韋爾
融資狀況:NetApp業(yè)務
業(yè)務方向:面向各類企業(yè)市場
Network Appliance,Inc.(NetApp,美國網(wǎng)域存儲技術有限公司)是IT存儲業(yè)界的佼佼者,自1992年創(chuàng)業(yè)以來,不斷以創(chuàng)新的理念和領先的技術引領存儲行業(yè)的發(fā)展。Network Appliance, Inc. (NetApp) 是向目前的數(shù)據(jù)密集型企業(yè)提供統(tǒng)一存儲解決方案的居世界最前列的公司。
NetApp StorageGRID 是一個久經(jīng)驗證的對象存儲軟件解決方案,設計用于管理 PB 級、全球分布的存儲庫,這些存儲庫包含企業(yè)和服務提供商的圖像、視頻和記錄。通過消除數(shù)據(jù)塊和文件中數(shù)據(jù)容器的典型約束,NetApp StorageGRID 提供了強大的可擴展性。它支持單個全局命名空間內(nèi)的數(shù)十億個文件或?qū)ο蠛?PB 級容量。
NetApp StorageGRID 實現(xiàn)了智能的數(shù)據(jù)管理和安全的內(nèi)容保留。它通過一個具有內(nèi)置安全性的全局策略引擎來優(yōu)化數(shù)據(jù)存放、元數(shù)據(jù)管理和效率,該引擎管理數(shù)據(jù)的存儲、放置、保護和檢索的方式。此外,使用數(shù)字指紋和加密等技術防止內(nèi)容受到篡改。
NetApp StorageGRID 有助于隨時隨地提供數(shù)據(jù),以便于不間斷地運營。該解決方案被設計為允許靈活進行部署配置,以滿足全球的多站點組織的不同需要。
企業(yè)名稱:Sybase
網(wǎng)址:www.sybase.com
上線時間:2011年
公司地址:美國加州Dublin市
融資狀況:Sybase業(yè)務
業(yè)務方向:面向各類企業(yè)市場
Sybase公司成立于1984年11月,總部設在美國加州的Emeryville(現(xiàn)為美國加州的Dublin市)。作為全球最大的獨立軟件廠商之一,Sybase公司致力于幫助企業(yè)等各種機構進行應用、內(nèi)容及數(shù)據(jù)的管理和發(fā)布。
Sybase IQ是Sybase公司推出的特別為數(shù)據(jù)倉庫設計的關系型數(shù)據(jù)庫。 相比于傳統(tǒng)的“行式存儲”的關系型數(shù)據(jù)庫, Sybase IQ 使用了獨特的列式存儲方式,在進行分析查詢時,僅需讀取查詢所需的列,其垂直分區(qū)策略不僅能夠支持大量的用戶、大規(guī)模數(shù)據(jù),還可以提交對商業(yè)信息的高速訪問,其速度可達到傳統(tǒng)的關系型數(shù)據(jù)庫的百倍甚至千倍?!半S著 Sybase IQ 不斷地在分析應用 POC 測試中拔得頭籌,有時甚至超過其他對手 100 倍之多”, Gartner 評價道,“ Sybase IQ 逐漸成為從數(shù)據(jù)集市到企業(yè)數(shù)據(jù)倉庫架構最令人渴望的 DBMS (數(shù)據(jù)庫管理系統(tǒng))?!?/p>
自 2009 年推出以來, Sybase 陸續(xù)發(fā)布了 Sybase IQ 15.1 、 15.2 、 15.3 以至最新的 Sybase IQ 15.4 版本,每個版本都著力于增加新的核心能力以促進更深入的高級分析。Sybase IQ 15.4是面向大數(shù)據(jù)的高級分析平臺,將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個人都行動的情報信息,從而在整個企業(yè)的用戶和業(yè)務流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。
因此,有人說Sybase IQ15.4正在徹底改變“大數(shù)據(jù)分析”。
企業(yè)名稱:惠普
網(wǎng)址:www.hp.com
上線時間:2011年
公司地址:美國加州帕羅奧多市
融資狀況:惠普業(yè)務
業(yè)務方向:面向各類企業(yè)市場
大數(shù)據(jù)時代來臨,老牌巨頭惠普也不甘落后。不久前惠普企業(yè)服務事業(yè)部宣布推出全新服務,幫助客戶更快部署惠普子公司Vertica的Vertica Analytics Platform ,從而迅速洞悉關鍵的業(yè)務信息,輔助決策過程。
Vertica Analytics Platform 讓用戶能夠大規(guī)模實時分析物理、虛擬和云環(huán)境中的結構化、半結構化和非結構化數(shù)據(jù),從而深入洞悉“大數(shù)據(jù)”。
Advanced Information Services for Vertica 幫助客戶最大化實現(xiàn) Vertica 分析平臺性能,并構建企業(yè)分析專用環(huán)境。惠普提供從評估到實施的一系列服務,與客戶共同定義多種交付方式組合,并找出匹配其現(xiàn)有基礎設施的最佳解決方案。
Advanced Information Services for Vertica已在全球上市,將為實現(xiàn)“瞬捷”企業(yè)構建靈活的智能環(huán)境。
企業(yè)名稱:沃爾瑪
網(wǎng)址:http://www.walmart.com/
上線時間:2011年
公司地址:本頓維爾
融資狀況:沃爾瑪業(yè)務
業(yè)務方向:未知
在這里看到沃爾瑪?shù)纳碛?,可能很多人會有疑問,全球最大的傳統(tǒng)零售業(yè)巨頭沃爾瑪怎么就跟大數(shù)據(jù)扯上關系了?看了下面的介紹你就會明白了。
沃爾瑪是最早通過利用大數(shù)據(jù)而受益的企業(yè)之一,曾經(jīng)擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng)。通過對消費者的購物行為等非結構化數(shù)據(jù)進行分析,沃爾瑪成為最了解顧客購物習慣的零售商,并創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例。早在2007年,沃爾瑪就已建立了一個超大的數(shù)據(jù)中心,其存儲能力高達4Pb以上?!督?jīng)濟學人》在2010年的一篇報道中指出,沃爾瑪?shù)臄?shù)據(jù)量已經(jīng)是美國國會圖書館的167倍。
沃爾瑪實驗室計劃將沃爾瑪?shù)?0個不同的網(wǎng)站整合成一個,同時將一個10個節(jié)點的Hadoop集群擴展到250個節(jié)點的Hadoop集群。目前實驗室正在設計幾個能將當前像Oracle、Neteeza這樣的開放資源的數(shù)據(jù)庫進行遷移、整合的工具。
沃爾瑪曾進行了一些列的收購,包括Kosmix(沃爾瑪實驗室前身)、Small Society、Set Direction、OneRiot、Social Calenda、Grabble等多家中小型創(chuàng)業(yè)公司,這些創(chuàng)業(yè)公司要么精于數(shù)據(jù)挖掘和各種算法,要么在移動社交領域有其專長,從此我們就可以看出沃爾瑪進軍移動互聯(lián)網(wǎng)和挖掘大數(shù)據(jù)的決心。相信在沃爾瑪?shù)膸ьI下,傳統(tǒng)行業(yè)也會慢慢意識到大數(shù)據(jù)的重要性,加速步入大數(shù)據(jù)時代。
初創(chuàng)企業(yè):
除了這些傳統(tǒng)的大企業(yè)已經(jīng)開始進入大數(shù)據(jù)領域之外,還有不少的創(chuàng)業(yè)企業(yè)也瞄準了大數(shù)據(jù)帶來的機會,紛紛推出自己的產(chǎn)品,以期抓住大數(shù)據(jù)時代的機會。
企業(yè)名稱:Clustrix
網(wǎng)址:www.clustrix.com
創(chuàng)辦時間:2005年
公司地址:美國加州舊金山
融資狀況:1200萬美元
業(yè)務方向:面向各類企業(yè)市場等
Clustrix 創(chuàng)立于2005年,是Y Combinator 2006年冬季班的成員。Clustrix可以為SQL數(shù)據(jù)庫提供專利數(shù)據(jù)應用方法,幫助人們處理大量的數(shù)據(jù),使SQL數(shù)據(jù)庫無限擴容成為可能。最近 Clustrix從Sequoia Capital、USVP和 ATA Ventures三家風險投資公司處再次獲得價值675萬美元的風險投資,至今已獲融資1200萬美元。Clustrix總部設在美國舊金山,研發(fā)中心設在西雅圖。為打開歐洲市場,公司計劃將總部遷至荷蘭的阿姆斯特丹,并將于年底前在印度設立辦公室。
企業(yè)名稱:Cloudera
網(wǎng)址:http://www.cloudera.com/
創(chuàng)辦時間:2009年
公司地址:美國加州帕洛阿爾托
融資狀況:4000萬美元
業(yè)務方向:面向各類企業(yè)市場等
Cloudera 是一家專業(yè)從事基于Apache Hadoop的數(shù)據(jù)管理軟件銷售和服務的公司,總部位于加州帕洛阿爾托,2009年3月發(fā)布了第一款商業(yè)產(chǎn)品,當時獲得由AccelPartners領投的500萬美元投資。該公司于2010年6月正式推出Cloudera企業(yè)產(chǎn)品。 2011年11月募集到4000萬美元風險投資資金,此輪融資由風險投資機構Ignition Partners的合伙人弗蘭克·阿泰勒(Frank Artale)領投。Cloudera之前的投資者頂尖風投機構Accel Partners、Greylock Partners、Meritech Capital Partners 和In-Q-Tel也參與本輪投資。
除以上企業(yè)以外,包括MapR、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop以及大數(shù)據(jù)相關的新公司都已經(jīng)獲得投資,新一輪熱潮正在興起。
看到以上這么多的國外企業(yè)已經(jīng)開始走上大數(shù)據(jù)之路,我們不禁想知道國內(nèi)有哪些企業(yè)在大數(shù)據(jù)方面有所建樹,但遺憾的是,與國外大數(shù)據(jù)的熱火朝天相比,國內(nèi)企業(yè)參與這一領域的并不多。
國內(nèi)企業(yè)在數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能等領域基礎薄弱,IT尤其是軟件企業(yè)在布局大數(shù)據(jù)方面,已經(jīng)遠遠落后于國外先進企業(yè)。對于哪些企業(yè)將來有可能成功進入大數(shù)據(jù)領域,挑起大數(shù)據(jù)利用國產(chǎn)化的重擔,不少人表示看好百度、阿里巴巴、騰訊等國內(nèi)互聯(lián)網(wǎng)巨頭,因為它們不僅具有資金、技術等方面的實力,而且一直在與數(shù)據(jù)打交道方面具有先發(fā)優(yōu)勢,其本身業(yè)務的發(fā)展趨勢與大數(shù)據(jù)發(fā)展趨勢相符。
實際上,作為中國最大的電子商務公司阿里巴巴已經(jīng)在利用大數(shù)據(jù)技術提供具體服務,主要內(nèi)容就是阿里信用貸款與淘寶數(shù)據(jù)魔方這兩部分業(yè)務。
以阿里信用貸款為例,阿里巴巴通過掌握的企業(yè)交易數(shù)據(jù),借助大數(shù)據(jù)技術自動分析判定是否給予企業(yè)貸款,全程不會出現(xiàn)人工干預。據(jù)透露,截至目前阿里巴巴已經(jīng)放貸300多億元,壞賬率約0.3%左右,大大低于商業(yè)銀行。
淘寶數(shù)據(jù)魔方則是淘寶平臺上的大數(shù)據(jù)應用方案。通過這一服務,商家可以了解淘寶平臺上的行業(yè)宏觀情況、自己品牌的市場狀況、消費者行為情況等,并可以據(jù)此作出經(jīng)營決策。
除了互聯(lián)網(wǎng)企業(yè)以外,也許還有一家不可忽略的企業(yè)極有可能在大數(shù)據(jù)領域異軍突起,那就是華為。盡管華為公司在大數(shù)據(jù)領域一直保持低調(diào)狀態(tài),但仍有相當一部分中國用戶期待華為產(chǎn)品和方案,這主要得益于多年來華為精心打造的“國產(chǎn)IT網(wǎng)絡通信產(chǎn)品、方案領導者”的品牌形象。
近年來,尤其是進入2012年以來,大數(shù)據(jù)漸漸地開始成為一個人們耳熟能詳?shù)男g語。有許多人認為2012年應該是大數(shù)據(jù)元年,更有甚者預測,下一個Facebook會誕生在大數(shù)據(jù)領域,不管這些看法有沒有道理,但至少我們可以看到大數(shù)據(jù)時代的帷幕已經(jīng)開啟。
如何發(fā)掘大數(shù)據(jù)的潛力?
下面向大家介紹一個數(shù)字,可能大家不常見到:百萬的5次方或一萬兆,即1,000,000,000,000,000,000(1后邊18個0)。IBM曾經(jīng)估算過一萬兆這個概念,即人類每天所產(chǎn)生的新的數(shù)據(jù)量為2.5萬兆。做個對比,地球五大洋里的海水總量為352萬兆加侖,如果一字節(jié)的數(shù)據(jù)量相當于一桶水的話,只需要5個月左右所產(chǎn)生的“水”就可以填滿整個五大洋。
對于企業(yè)來說,面對并管理這些浩如煙海的數(shù)據(jù)時真的感覺無能為力。Oracle今年6月份發(fā)出報告稱,300家美國和加拿大企業(yè)中93%的承認因為沒法處理他們身邊的數(shù)據(jù)而損失了一些盈利的機會。
某 “大數(shù)據(jù)”公司的首席營銷系統(tǒng)專員Pete Elliott可以幫助大小企業(yè)從浩如煙海的數(shù)據(jù)(比如博客、推特、Facebook中的贊、鏈接、圖像、視頻、評論、文本文件、回復,甚至集裝箱貨單)中找到可以利用的信息。Elliott說,數(shù)據(jù)越多,搜索速度越快,客戶越喜歡。
首先我們要理清一個概念:大數(shù)據(jù),并不意味著大生意。數(shù)據(jù)分析才是帶來利潤和提高利潤的途徑。不管是大企業(yè)還是小企業(yè),都需要在市場中保持競爭力,這就需要根據(jù)大數(shù)據(jù)來做相應的市場、競爭分析,因為競爭對手也很有可能會做這種類型的數(shù)據(jù)分析。雖然說每天產(chǎn)生2.5萬兆的數(shù)據(jù),如果不對這些信息加以整理,沒法正常使用和理解的話,也是沒有意義的。然而隨著計算機技術的發(fā)展,編程人員開發(fā)出了效率更高的軟件,可以幫助企業(yè)更好地搜集、篩選、整理,最終將數(shù)據(jù)轉(zhuǎn)換成對未來發(fā)展的分析,成為企業(yè)競爭的有利條件。
IBM 企業(yè)營銷管理副總裁Yuchun Lee建議企業(yè)先從“企業(yè)網(wǎng)站”開始進行大數(shù)據(jù)分析。他說,“只要有人登陸網(wǎng)站,就有利用大數(shù)據(jù)的機會?!睂τ陔娮由虅掌髽I(yè)來說,企業(yè)網(wǎng)站就是一種營銷工具。Elliott也說,“使用大數(shù)據(jù)最好先從簡單的方面開始入手,慢慢測試,最終擴大適用范圍。”
McKee Wallwork Cleveland公司的主席Steve McKee(本文作者)最近做了一次大數(shù)據(jù)服務,服務范圍已經(jīng)超過了網(wǎng)站流量。我們跟蹤了客戶的媒體消耗時間、網(wǎng)站瀏覽、客戶詢價,購買了相應的數(shù)據(jù),最終發(fā)現(xiàn)了以上幾者的關系。我們還根據(jù)結果跟蹤了人們購買產(chǎn)品之后廣告營銷的漲跌情況。這里利用大數(shù)據(jù)分析的結果幫助McKee Wallwork Cleveland的客戶提高了媒體投資效率,預計2013年將提高9個百分點。
數(shù)據(jù)也會對消費者滿意度有非常重要的影響。Verint Systems公司的資深營銷副總裁Ryan Hollenbeck講了一個消費者打電話給客服中心問詢的故事。客戶發(fā)現(xiàn)企業(yè)的廣告中有誤導行為(非有意而為之)。另一位客戶利用語音分析發(fā)現(xiàn)客服對話中有客戶想取消賬號,他們根據(jù)關鍵詞、關鍵句來判斷這些可能流失的客戶,這位企業(yè)客戶通過大數(shù)據(jù)分析挽救了600多位風險客戶,避免了1200萬美元的損失。
或許大數(shù)據(jù)最令人興奮的地方就是幫助企業(yè)預測未來。許多警察局利用歷史數(shù)據(jù)來預測“何時何地”可能發(fā)生犯罪,企業(yè)利用消費者在線行為數(shù)據(jù)開發(fā)他們想要的產(chǎn)品。對于營銷人員來說,社交媒體之前曾經(jīng)是企業(yè)與客戶實時互動的地方,現(xiàn)在有了大數(shù)據(jù),可以更深入地挖掘消費者信息,由此來改進產(chǎn)品,發(fā)現(xiàn)消費者的需求。Hollenbeck說:“社交媒體上人們的對話交流或許有進一步發(fā)展的巨大潛力!”(TECH2IPO注:對話中人們會直接提到自己的購買意向)
如何發(fā)掘大數(shù)據(jù)的潛力?不試試怎么知道。企業(yè)需要做的就是去試一下大數(shù)據(jù)服務,領略一下它能企業(yè)帶來的飛一般地進步。Elliott說,基于云服務的復雜數(shù)據(jù)分析未來可能會非常廉價,低至1000美元/次。
十年前,人們面對面做生意,企業(yè)要和客戶打交道只能從很窄的層面了解客戶。如今網(wǎng)絡上隨意的交談都有可能變成發(fā)生產(chǎn)品交易的前提。企業(yè)如果依舊不認同大數(shù)據(jù),看不清大數(shù)據(jù)和消費者的關系,依舊不能利用大數(shù)據(jù),很有可能喪失一個寶貴的機會。
?
電子發(fā)燒友App








評論