成人欧美视频,欧美1区,国产精品视频久久

今天項目中遇到了中文編碼的zip文件，處理了蠻長時間，所以記錄下，以免下次踩坑。

python2下

python2中讀取zip文件，zipfile.zipinfo的filename類型是str，基本上類似于python3中的bytes，即可以被decode為unicode。

所以，要處理中文，只需要將文件名按照編碼decode成unicode就好。

				?

									import zipfile

									fpath = '/path/to/zip.zip'

									zfile = zipfile.zipfile(fpath, 'r')

									for fileinfo in zfile.filelist:

									  print fileinfo.filename.decode('gb18030')

									  # 如果要更加詳細的區分bytes/str/unicode的語義

									  print bytes(fileinfo.filename).decode('gb18030')

python3下

python3中，language encoding flag (efs)如果是1，則按照utf8來處理文件編碼，efs如果為0，則直接按照cp437解碼文件名。這是標準直接規定的。

但是，很多軟件在制作zip壓縮包的時候，直接使用gb18030或者其他非標準編碼格式來編碼文件名，所以我們還得將文件名反轉為bytes，然后再使用對應的編碼方式解碼：

				?

									fpath = '/path/to/zip.zip'

									zfile = zipfile.zipfile(fpath, 'r')

									for fileinfo in zfile.filelist:

									  print(fileinfo.filename.encode('cp437').decode('gb18030'))