一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python 2/3下處理cjk編碼的zip文件的方法

Python 2/3下處理cjk編碼的zip文件的方法

2021-06-20 00:27Robert''s Blog Python

今天小編給大家分享Python 2/3下處理cjk編碼的zip文件的方法,在項目中經常會遇到這樣的問題,小編特意分享到腳本之家平臺,感興趣的朋友跟隨小編一起看看吧

今天項目中遇到了中文編碼的zip文件,處理了蠻長時間,所以記錄下,以免下次踩坑。

python2下

python2中讀取zip文件,zipfile.zipinfo的filename類型是str,基本上類似于python3中的bytes,即可以被decode為unicode。

所以,要處理中文,只需要將文件名按照編碼decode成unicode就好。

?
1
2
3
4
5
6
7
import zipfile
fpath = '/path/to/zip.zip'
zfile = zipfile.zipfile(fpath, 'r')
for fileinfo in zfile.filelist:
  print fileinfo.filename.decode('gb18030')
  # 如果要更加詳細的區分bytes/str/unicode的語義
  print bytes(fileinfo.filename).decode('gb18030')

python3下

python3中,language encoding flag (efs)如果是1,則按照utf8來處理文件編碼,efs如果為0,則直接按照cp437解碼文件名。這是標準直接規定的。

但是,很多軟件在制作zip壓縮包的時候,直接使用gb18030或者其他非標準編碼格式來編碼文件名,所以我們還得將文件名反轉為bytes,然后再使用對應的編碼方式解碼:

?
1
2
3
4
fpath = '/path/to/zip.zip'
zfile = zipfile.zipfile(fpath, 'r')
for fileinfo in zfile.filelist:
  print(fileinfo.filename.encode('cp437').decode('gb18030'))

方法都有了,那直接根據文件名智能猜測文件編碼,然后解壓就好。但是由于單個文件名太短,chardet的猜測可能不準,所以我們可以直接將所有的文件名連接起來,猜測編碼。

代碼請參考 mczip ,兼容python2和python3。

總結

以上所述是小編給大家介紹的python 2/3下處理cjk編碼的zip文件的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對服務器之家網站的支持!

如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

原文鏈接:https://www.robberphex.com/2019/04/1022

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 1769亚洲欧美资源站 | 欧美日韩一区二区三区在线观看 | 午夜国产理论 | 边摸边吃奶边做爽gif动态图 | 亚洲激情一区 | 美女的让男人桶爽网站 | 亚洲va欧美va天堂v国产综合 | 国产美女下面流出白浆视频 | 欧美日本一本线在线观看 | 国产一级网站 | 国产悠悠视频在线播放 | 日韩精品视频在线观看免费 | 九九九九九九 | 日韩 欧美 国产 亚洲 中文 | 亚洲 欧美 中文 日韩欧美 | 黑人同学征服教师麻麻 | 亚洲高清毛片一区二区 | 龟甲情感超市全文阅读 小说 | 女人把私密部位张开让男人桶 | 欧美三茎同入 | 本站只有精品 | 亚洲国产成人精品激情 | 韩国黄色片网站 | 韩国美女被的免费视频 | 男同激情视频 | 美女扒开屁股 | 亚洲视频在线免费 | 398av影院视频在线 | 国产精品合集久久久久青苹果 | 亚洲欧美在线观看首页 | 国产成人精品日本亚洲网站 | 青青国产在线观看 | 古装一级无遮挡毛片免费观看 | 欧美free激情野战hd | 国产视频99 | 国色天香社区在线 | 福利视频久久 | 国产成人综合亚洲亚洲欧美 | 国产99久久久国产精品成人 | 俄罗斯男男激情1069gay | 极品在线 |