原因由于zip格式并沒有指定編碼格式,Windows下生成的zip文件中的編碼是GBK/GB2312等,因此,導(dǎo)致這些zip文件在Linux下解壓時(shí)出現(xiàn)亂碼問題,因?yàn)長inux下的默認(rèn)編碼是UTF8。解決方案一使用7z解壓。安裝p7zip和convmv# fedora
$ su -c 'yum install p7zip convmv'
# ubuntu
$ sudo apt-get install p7zip convmv執(zhí)行一下命令解壓縮# 使用7z解壓縮
$ LANG=C 7za x your-zip-file.zip
# 遞歸轉(zhuǎn)碼
$ convmv -f GBK -t utf8 --notest -r .解決方案二在windows上壓縮的文件,是以系統(tǒng)默認(rèn)編碼中文來壓縮文件。由于zip文件中沒有聲明其編碼,所以linux上的unzip一般以默認(rèn)編碼解壓,中文文件名會(huì)出現(xiàn)亂碼。雖然2005年就有人把這報(bào)告為bug, 但是info-zip的官方網(wǎng)站沒有把自動(dòng)識(shí)別編碼列入計(jì)劃,可能他們不認(rèn)為這是個(gè)問題。Sun對java中存在N年的zip編碼問題,采用了同樣的處理方式。有2種方式解決問題:1. 通過unzip行命令解壓,指定字符集unzip -O CP936 xxx.zip (用GBK, GB18030也可以)有趣的是unzip的manual中并無這個(gè)選項(xiàng)的說明, unzip --help對這個(gè)參數(shù)有一行簡單的說明。2. 在環(huán)境變量中,指定unzip參數(shù),總是以指定的字符集顯示和解壓文件/etc/environment中加入2行UNZIP="-O CP936"
ZIPINFO="-O CP936"這樣Gnome桌面的歸檔文件管理器(file-roller)可以正常使用unzip解壓中文,但是file-roller本身并不能設(shè)置編碼傳遞給unzip。