09/10/14 14:07:29
【 課題 】1.任意のWebページから、"http://"で始まるハイパーリンクを抽出するように下のプログラムを改良
URLリンク(rg550.hp.infoseek.co.jp)
2.上のプログラムと下のプログラムを合わせて任意のWebページ10ページに含まれる単語のうち
上位10位の単語リストとその出現頻度を表示
URLリンク(rg550.hp.infoseek.co.jp)
【 形態 】Javaアプリケーション(main()で開始)
【 GUI 】制限なし
【 期限 】10/15
【 Ver 】1.6.0_11
【 用語 】
【 補足 】2.はsenという形態素解析器がないと実行できないと思いますが
プログラムコードだけでもどうかよろしくお願いします。