本文總結(jié)推薦22個(gè)免費(fèi)的數(shù)據(jù)可視化和分析工具。列表如下:
數(shù)據(jù)清理(Data cleaning)
當(dāng)你分析和可視化數(shù)據(jù)前,常需要“清理”工作。比如一些輸入性列表“New York City” ,同時(shí)其他人會(huì)說”New York, NY” 。因此你需要標(biāo)準(zhǔn)化這些工作,使看到統(tǒng)一的樣式。下面的兩個(gè)工具被用來幫助使數(shù)據(jù)處于***的狀態(tài)。
1、DataWrangler
斯坦福大學(xué)可視化組(SUVG)設(shè)計(jì)的基于web的服務(wù),以你剛來清理和重列數(shù)據(jù)。點(diǎn)擊一個(gè)行或列,DataWrangler 會(huì)彈出建議變化。比如如果你點(diǎn)擊了一個(gè)空行,一些建議彈出,刪除或刪除空行的提示。它的文本編輯很cooool。
2、Google Refine
Google Refine。用戶在電腦上運(yùn)行這個(gè)應(yīng)用程序后就可以通過瀏覽器訪問之。這個(gè)東西的主要功能是幫用戶整理數(shù)據(jù),接下來的演示視頻效果非常好:用戶下載了一個(gè) CSV 文件,但是同一個(gè)欄中的同一個(gè)屬性有多種寫法:全稱,縮寫,后面加了空格的,單數(shù)復(fù)數(shù)格式不一的。。。但是這些其實(shí)都代表了同一個(gè)屬性,Google Refine 的作用就是幫你把這些不規(guī)范的寫法迅速統(tǒng)一起來。
統(tǒng)計(jì)分析(Statistical analysis)
有時(shí),你需要你的數(shù)據(jù)的圖形化的表達(dá)。
3、R 項(xiàng)目
R語言是主要用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。雖然R主要用于統(tǒng)計(jì)分析或者開發(fā)統(tǒng)計(jì)相關(guān)的軟體,但也有人用作矩陣計(jì)算。其分析速度可比美GNU Octave甚至商業(yè)軟件MATLAB。
可視化應(yīng)用與服務(wù)(Visualization applications and services)
這些工具提供了不同的可視化選項(xiàng),針對(duì)不同的應(yīng)用場(chǎng)景。
4、Google Fusion Tables
Google Fusion Tables 被認(rèn)為是云計(jì)算數(shù)據(jù)庫的雛形。還能夠方便合作者在同一個(gè)服務(wù)器上分享備份,email和上傳數(shù)據(jù),快速同步不同版本數(shù)據(jù),F(xiàn)usion Tables可以上傳100MB的表格文件,同時(shí)支持CSV和XLS格式,當(dāng)然也可以把Google Docs里的表格導(dǎo)入進(jìn)來使用。對(duì)于大規(guī)模的數(shù)據(jù),可以用Google Fusion Tables創(chuàng)造過濾器來顯示你關(guān)心的數(shù)據(jù),處理完畢后可以導(dǎo)出為csv文件。
Google Fusion Tables的處理大數(shù)據(jù)量的強(qiáng)大能力,以及能夠自由添加不同的空間視圖的功能,也許會(huì)讓 Oracle,IBM, Microsoft傳統(tǒng)數(shù)據(jù)庫廠商感到擔(dān)心,Google未來會(huì)強(qiáng)力介入數(shù)據(jù)庫市場(chǎng)。
5、Impure
Impure,允許點(diǎn)擊、拖曳來連接模塊,由西班牙分析公司Bestiario 創(chuàng)建。
6、Tableau Public
7、Many Eyes
8、VIDI
9、Zoho Reports
10、Choosel
11、Exhibit
12、Google Chart Tools
13、JavaScript InfoVis Toolkit
14、Protovis
15、Quantum GIS (QGIS)
16、OpenHeatMap
17、OpenLayers
18、OpenStreetMap
19、TimeFlow
20、IBM Word-Cloud Generator
21、Gephi
22、NodeXL