09/04/19 20:25:51
>>107
> あとbzで圧縮するとutf-8は恐ろしく小さくなる。
はい、ダウト。
$ wc -c hoge.txt
265412 hoge.txt
$ nkf -Ee hoge.txt | bzip2 -9 | wc -c
53585
$ nkf -Ew hoge.txt | bzip2 -9 | wc -c
54065
EUCの方が良く圧縮されるね。
参考までに、gzipだとさらに差が開く。
$ nkf -Ee hoge.txt | gzip -9 | wc -c
72506
$ nkf -Ew hoge.txt | gzip -9 | wc -c
79244