一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務(wù)器之家:專注于服務(wù)器技術(shù)及軟件下載分享
分類導(dǎo)航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術(shù)|正則表達(dá)式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務(wù)器之家 - 編程語言 - R語言 - R語言讀取xls與xlsx格式文件過程

R語言讀取xls與xlsx格式文件過程

2022-01-20 15:46Kanny廣小隸 R語言

這篇文章主要為大家介紹了使用R語言讀取xls與xlsx格式文件的過程步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步早日升職加薪

在數(shù)據(jù)分析的過程中,第一步就是讀取數(shù)據(jù)。

通常我們遇到的數(shù)據(jù)是csv格式或者txt格式的數(shù)據(jù),這時(shí)我們使用系統(tǒng)自帶的read.csv()read.table()就可對(duì)這些格式的數(shù)據(jù)進(jìn)行讀取,只是讀取時(shí)需注意編碼格式。對(duì)于大型csv格式的數(shù)據(jù)(當(dāng)然小數(shù)據(jù)也可以),可以使用data.table包中的fread()進(jìn)行讀取可以極大地提升讀取速度。

但當(dāng)遇到了Excel表生成的文件,讀取起來相對(duì)就沒有那么友好。之前的做法是簡(jiǎn)單粗暴地直接將我們的xlsxlsx文件利用Excel轉(zhuǎn)化為csv文件后再進(jìn)行讀取,亦或者直接就用Python使用pandas庫進(jìn)行處理,然后就在Python中進(jìn)行分析。

就是由于之前幾次碰壁,使用網(wǎng)上推薦的一些包來進(jìn)行讀取,但都以失敗告終。不過這次還是決定解決這個(gè)“頑疾”,對(duì)xls與xlsx這兩種文件用R進(jìn)行讀取。

這幾種方法主要參考:Read Excel files from R

1. ROOBC

這個(gè)包中有函數(shù)可以讀取xlsx格式的文件,但對(duì)于現(xiàn)在的我們而言,絕大多數(shù)人的電腦都不能使用這個(gè)包,因?yàn)槠渲荒苡糜?2位系統(tǒng)的Windows,所以這里不對(duì)這個(gè)包進(jìn)行贅述。

2. xlsReadWrite

只能從GitHub中獲得,CRAN上還沒有,也不進(jìn)行過多的贅述。

3. XLConnect

要依賴java,并且對(duì)于大數(shù)據(jù)情況讀取非常慢。但實(shí)際上自己使用的時(shí)候,安裝了java后,還是沒法使用這個(gè)包。可能是某些步驟設(shè)置出現(xiàn)了問題。

若有童鞋對(duì)前面的三個(gè)包非常感興趣,其詳細(xì)的用法可以參考前面的參考網(wǎng)址。

4. xlsx

這個(gè)包是目前用的最多,也是R中可以說最好用的讀取Excel文件的利器。

下面專門對(duì)其進(jìn)行介紹。首先我們先說明這個(gè)包的依賴文件,不僅僅只是依賴R中的一些包,而是需要單獨(dú)安裝java。

1)裝Java

安裝鏈接:https://www.java.com/zh_CN/download/

我們按照指引選擇默認(rèn)路徑安裝,安裝完成后,在C:\Program Files下出現(xiàn)了Java文件,說明安裝成功。(注:有些地方說需要將Java文件添加到全局變量中,后面的xlsx包才能調(diào)取成功,但其實(shí)在這兩天的實(shí)際安裝中發(fā)現(xiàn),自己的電腦并不需要,可能得看臉。)

2)裝xlsx

安裝xlsx其實(shí)沒什么好說的,就正常安裝,然后它會(huì)自動(dòng)將所需要的rjava等依賴庫,最后成功安裝xlsx庫。

3)實(shí)際使用

最后我們就能直接使用啦,下面來講一下其代碼格式:

?
1
2
library(xlsx)
dat <- read.xlsx("data.xlsx", sheetName = "Sheet1", encoding = 'UTF-8')

一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)讀取如上所示,下面將幾個(gè)常用的參數(shù):

"data.xlsx":表示讀取數(shù)據(jù)的名稱。

sheetName:表示讀取表中表的名稱,通常第一個(gè)就是Sheet1

encoding:這個(gè)在讀取中文數(shù)據(jù)的時(shí)候是一定要加上的,不然讀取數(shù)據(jù)會(huì)出現(xiàn)亂碼。

sheetIndex:表示讀取文件中第幾個(gè)表,sheetIndex = 1表示讀取文件中第一個(gè)表。

需要特別注意:當(dāng)文件中我們的表明為中文字時(shí),不能使用類似sheetName = "表1"進(jìn)行讀取,即使加上encoding = 'UTF-8'也會(huì)出現(xiàn)讀取錯(cuò)誤,這時(shí)就需要使用sheetIndex來進(jìn)行讀取。

以上就是R語言讀取xls與xlsx格式文件過程的詳細(xì)內(nèi)容,更多關(guān)于R讀取文件的資料請(qǐng)關(guān)注服務(wù)器之家其它相關(guān)文章!

原文鏈接:https://kanny.blog.csdn.net/article/details/81911295

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 天堂网www中文天堂在线 | 国产第一综合另类色区奇米 | 狠狠色婷婷狠狠狠亚洲综合 | 亚洲精品中文字幕久久久久久 | 女bbwxxxx非洲黑人 | 男生操女生的漫画 | 美女张开双腿让男人捅 | 火影忍者羞羞 | 91制片厂免费观看 | 日本护士xxxx爽爽爽 | 女bbbbxxxx视频 | 公妇仑乱在线观看 | 91一区二区在线观看精品 | 7788理论片在线观看 | 9久热这里只有精品视频在线观看 | 亚洲国产一区二区a毛片 | 向日葵视频app下载18岁以下勿看 | bestialitysex杂交 bedfriend泰剧全集免费观看 | 粉嫩国产14xxxxx0000| 国产福利片在线 易阳 | 欧美一区二区三区高清不卡tv | 电车痴汉中文字幕 | 5566中文字幕亚洲精品 | 2021久久| 婷婷麻豆| 欧美国产日韩1区俺去了 | 99爱爱| 精品国产乱码久久久久久软件 | 热99re久久精品国产首页 | 四虎精品永久免费 | 四虎影视在线影院在线观看 | 91亚洲精品第一综合不卡播放 | 久久亚洲高清观看 | 国产精品原创永久在线观看 | 久久国产精品福利影集 | 九九大香尹人视频免费 | 国产亚洲成归v人片在线观看 | 亚洲人成影院午夜网站 | 免费成年网站 | 性伴交换多p | 波多野结衣中文字幕乱七八糟 |