07/04/08 03:27:22
すみません、教授から新しい任務を与えられてしまい、やはりエンコードで躓いています・・・
テンプレにあるように丸投げ、ということではなくなってしまうのですが
【 課題 】gzipでそれぞれ圧縮された4つのログファイルに含まれるURLを読み込み、
ディレクトリの種類毎にそれぞれナンバリングして対応表のファイル及び
そのナンバーが記載されたログファイルを出力せよ。
4つのログファイルのうちの一つは(URLリンク(uproda11.2ch-library.com))
【 補足 】>>181のログファイルはこの圧縮されたログファイルの一部です。
(このログファイルは展開すると一つが75Mほどになります。)
URLの頭は全て「music」になっているので無視し、
その下の「Songs」を「1」、「Musics」を「2」とします。
さらにその下の階層では「Chinese」、「English」となっているので、
「/Songs/Chinese」が「11」、
「/Songs/English」が「12」
・・・という風になります。
URLが「/Songs」から開始する(つまり一桁目が「1」になる)ファイルを
時間順に上記のナンバーに変換し、新たなログファイルとして出力します。
またこのログファイルとは他に、ディレクトリ名及びファイル名の対応表
(Songs:1、Chinese:1、English:2)を出力します。