09/04/12 01:16:45 .net
◆ 改行コード
Windowsでは \r\n、Macintoshでは \r、UNIXでは \n のように、OSによって改行コードが異なります。
入力ファイルの改行コードに関わらず、自分の環境に適した改行コードに変換するには以下のようにします。
(UNIX、Windowsで確認。Macintoshでは未確認)
while (<IN>) {
s/[\r\n]*$//;
print "$_\n";
}
Windowsでは $_\n ではなく $_\r\n にすべきだと思われるかもしれませんが、Windows上で上記のスクリプトを実行した場合、
STDOUT や OUT への出力は \n が \r\n に自動変換されて書き込まれます。これをテキストモードと呼びます。
この自動変換を行わないようにしたい時は binmode()を用いてバイナリモードにしてください。
UNIXでは常にバイナリモード(というか、テキストモードとバイナリモードの動作が同じ)となります。
任意の改行形式のファイルを読みとって、UNIXの改行形式のファイルに変換する例は次のようになります。
open(IN, "any.txt");
open(OUT, "> unix.txt");
binmode(OUT);
while (<IN>) {
s/[\r\n]*$//;
print OUT "$_\n";
}
close(IN);
close(OUT);