08/08/16 17:25:24 e5SezU1t
>>124
是非お願いします。
以前、部分的に作りかけたんだけど、途中でほったらかしです。
一応、御参考までに書いときますね。
(1) [EPWING] -> EBDump -> [EBDump出力ファイル] -> ebd2html -> [HTML]
が使えると想定して、これを独自形式のXMLにしてから、最終的にTVSにするという構想で以前作りかけた。
(2) [HTML] -> 独自ツール1 -> [独自形式XML] -> 独自ツール2 -> TVS
(3) TVS -> SIIのツール -> SII辞書
これで、Excelみたいなものがなくても出来る筈。XMLならスクリプト言語で操作し易いし、Excelの行数制限も回避できる。
ここで(2)の部分はWindows以外(UNIX上とか)でも処理できるし。
ExcelはCSVはShift_JISなのかな。TSVはUTF-16? 文字表現能力からTSVだけを相手にすることに決定。
(しかしSIIの電子辞書にはどういう文字のフォントが用意されてるんだろ?)
で、[独自形式XML]をでっち上げて、独自ツール2 をPerlで書いてみたんだけど、
ExcelのTSVやSIIのツールの仕様の詳細が分からなくて面倒になって中断したままだ。
SIIのサンプルだと、先頭の方にカラム定義みたいな行あがるけど、
これは、実際のデータの最大カラムに合わせて増減すればいいのか、とか、数字は全角じゃないといけないのかとか、、、。
ID 見出し語 ... 例文1 例文2 例文3 例文4 ...例文200
1セルの中の改行なんかの扱いにも疑問点があった様な気がする。