午夜免费看片,四虎麻豆,国产愉拍

R語言在碰到讀UTF-8文件，或者處理UTF-8數(shù)據(jù)時(shí)總是會(huì)遇到各種各樣的問題，本姑娘也是在碰了n多次壁，被氣得吐血好多次之后，終于對(duì)這類總結(jié)出了一些解決辦法：

1. 讀UTF-8文件. 例如UTF-8格式的csv：

最好的處理辦法就是：

a1=read.table('C:\\test11.csv',sep=',',fileEncoding = 'UTF-8',header = F)

如果使用如下方法可能會(huì)出錯(cuò)（全是血淚教訓(xùn)啊）：

a2=read.csv('C:\\test11.csv',fileEncoding = 'UTF-8',header = F)
a2=read.csv('C:\\test11.csv',encoding = 'UTF-8',header = F)

2. 如何在R里把一個(gè)數(shù)據(jù)轉(zhuǎn)化為UTF-8格式：

因?yàn)槲以赗里寫了一段程序，需要把數(shù)據(jù)轉(zhuǎn)化為JSON格式，通過上面的方法讀進(jìn)來的數(shù)據(jù)是沒有問題，但是數(shù)據(jù)再R里并不是utf-8格式存儲(chǔ)的，所以toJSON()時(shí)報(bào)了如下錯(cuò)誤：

unable to escape string. String is not utf8

后來發(fā)現(xiàn)R里有一個(gè)函數(shù)可以把數(shù)據(jù)轉(zhuǎn)為utf8格式：enc2utf8()

> a='小源'
> Encoding(a)#查看a的編碼格式
[1] "unknown"
> b=enc2utf8(a)
> Encoding(b)
[1] "UTF-8"

3. 如何SOURCE一個(gè)UTF-8格式的R文件：

source一個(gè)utf8編碼保存的R腳本，在windows下（linux由于默認(rèn)編碼就是utf8，直接source就可以）

source('test.R',encoding = 'UTF-8')

補(bǔ)充：mac系統(tǒng)csv亂碼_R語言寫入U(xiǎn)TF-8格式CSV亂碼解決辦法

中文編碼方式有GBK(GB2312)和UTF-8兩種。

由于區(qū)域設(shè)置問題，在Windows系統(tǒng)下，Excel程序默認(rèn)用GBK格式讀取CSV文件。

因此會(huì)導(dǎo)致亂碼。

如下圖所示：

R語言 UTF-8各種問題的解決方案

解決的辦法是用tidyverse包中的write_excel_csv()函數(shù)。

下面上代碼：

library(tidyverse)
x <- c('好好地', '針對(duì)是棒極啦', '哈好好好好好愛吼吼吼啊', '啊')
y <- c(1, 2, 3, 4)
z <- c('haha', 'hehe', 'hoho', 'lala')
xyz_tbl <- tibble(x,y,z)
      read_csv(file = 'data1.csv', )
#亂碼
write.csv(xyz_tbl,'data_old.csv',row.names = T,fileEncoding='UTF-8')
#再次亂碼
write_csv(xyz_tbl, 'data.csv')
#解決問題
write_excel_csv(xyz_tbl, 'data_ex.csv')
#以上文件用R讀取都沒問題
read_csv(file = 'data.csv')
read_csv(file = 'data_ex.csv')
read_csv(file = 'data_old.csv')

R語言 UTF-8各種問題的解決方案