【辞書自作】SR-S9000 SL900X【SII 電子辞書】at DGOODS
【辞書自作】SR-S9000 SL900X【SII 電子辞書】 - 暇つぶし2ch79:名無しさん@3周年
08/06/03 18:12:43 kdPIKD3j
>>75
epwing の形式から、 SIIの自作辞書を作る為のエクセルの形式に変換できれば、
SIIが提供してる、ソフトで、独自仕様の辞書に変換できる

80:名無しさん@3周年
08/06/03 21:19:57 6pQts+nH
>>79
エクセル形式でもなんでもねえ
csvてなただのcsvつまりテキストファイル

epwingからテキストファイル抽出することがそもそも至難の業なんだが

81:名無しさん@3周年
08/06/04 21:48:43 TXqPG06V
>>80
epwingの仕様が分からない。。
本とかであるのかな?

データ構造が分かればテキスト抽出はそんな難しくないのでは?

82:名無しさん@3周年
08/06/06 13:11:19 8gBO1Cl4
EBdump ebd2html EBfont


83:名無しさん@3周年
08/06/06 14:56:24 yL4dIZkS
URLリンク(page10.auctions.yahoo.co.jp)

84:名無しさん@3周年
08/06/06 17:09:56 vba0F0wN
URLリンク(www.auction.co.jp)

85:名無しさん@3周年
08/06/07 15:25:15 leULsCGg
エネループは使えるのかな

86:名無しさん@3周年
08/06/08 14:52:32 6EL5JEjt
>>80
どっちもテキストファイルじゃねーよw
テキストファイルってのを理解してるのか?

形式ってのは、情報をどういったフォームで配置するかってことだぞ。
テキストだったら、指定された文字コードでファイルの先端から一定のビット長ごとに並べられている。
csvでもtxtでもepwingでも、それぞれの規則にしたがって情報が配置されている。

つまり、その配置されている法則さえ理解できれば相互変換できる。
ただ、wpwingはその法則がややこしいってだけ。

87:名無しさん@3周年
08/06/08 21:11:48 G+AjoIW0
>>80,86
80が言ってるのは、
「CSVがテキストファイル」と「EPWINGから(データを)テキストファイル(形式に)抽出する」ってことじゃないか?
なにも問題ない。
86の
> どっちもテキストファイルじゃねーよw
は、「Excelの標準の形式(xlsとか)とEPWINGがテキストじゃない」ってことだろ?
早とちりし過ぎ。

CSV (Comma Separated Values)はコンマ区切りで値を並べたテキストファイルってことでいいよな。
TSVはTab区切りな。

で、SIIのやつなんだが、昨日やっと説明書PDFを見たよ。
(ふだんはMac使っててPC立ち上げるのが面倒なんで。)
Excelでデータ用意しているけど、データを辞書にするところではTSVファイルみたいに書いてあるな。
だとすればテキストファイルを用意すればよいわけでExcelの行数制限とかも問題ない、ってことでいいのかな?


88:名無しさん@3周年
08/06/08 21:17:14 G+AjoIW0
SL900Xの本体ソフトの更新もした。
なんか、反応が速くなった気がする。
リスト中を矢印キーで連続移動する際の行き過ぎも起こらなくなった気がするんだけど、
気のせい? (プラセボ?)

>・シルカカードレッド装着時の機能改善
ってどういう点?

しかし、SIIの本体更新や辞書作成の説明書、電子辞書のできの良さからはうそのように分かり難いな。
まあ、分かるからいいし、他社のと比べて遜色は無いんだけど、SIIには期待しちゃうからちょっとがっかり。

89:名無しさん@3周年
08/06/09 04:49:25 jGBIslMe
>>87
なら、>>80のいいたいことは何なんだ?
csvてなただのcsvつまりテキストファイル ← 頭悪いの?


90:名無しさん@3周年
08/06/09 11:24:08 JhrlI9ao
> エクセル形式でもなんでもねえ
Excel固有の形式ではない。
> csvてなただのcsvつまりテキストファイル
CSVと書いてあるのは、文字通りのComma Separated Valuesつまりテキストファイル(だからExcelなしで用意できる)
っていうくらいのことじゃないのか?
80じゃないから実際のところはわからないけど、それくらいの可能性は想像できるだろ?

91:名無しさん@3周年
08/06/09 12:06:16 FbHghv2Z
英辞郎の辞書とかは変換できそうだね

92:名無しさん@3周年
08/06/09 14:55:45 OGA59qgI
URLリンク(page10.auctions.yahoo.co.jp)

93:名無しさん@3周年
08/06/09 19:35:49 jGBIslMe
>>90
お前は>>80か?
俺にはただのあほにしか見えない。

94:名無しさん@3周年
08/06/09 23:11:41 q7Q2pFZ0
>>86>>89>>93
必死www

95:名無しさん@3周年
08/06/09 23:55:15 usTPacPX
>>86>>89>>93
じゃましにきてるのか? www

96:名無しさん@3周年
08/06/10 18:08:30 zolHVDs8
>>94>>95
自己紹介か?

97:名無しさん@3周年
08/06/13 14:18:13 PdTBjIl2
ところで、
SR-S9000にSIIからダウンロードできるサンプル辞書追加したけど、結構面白いね。
KY式なんてくだらな過ぎて良い暇つぶしになる

98:名無しさん@3周年
08/06/14 19:34:14 KhKKDJRQ
一部のmp3で、長さが実際の十倍ぐらいに認識され、再生すると最後のほうが途切れてしまうもの
があるのですが、バグでしょうか。

ファイルのコピーに失敗している可能性を考え、いちどファイルを削除した上で何回かコピーしなおしても
改善されません。アンマウント操作は正しく行っています。

99:98
08/06/14 20:31:11 KhKKDJRQ
・リセット
・ファームウェアのアップデート
・内部メモリのフォーマット
・別機種付属のUSBケーブル使用
・SDカードの使用

すべてやりましたが改善されません。
いろいろなファイルを試してみると、長さが00分00秒として認識されてしまうファイル
もありました。

仕様の通り、32~320kbps内のMP3ファイルを使用しています。
機種はSL900Xです。

何か改善のためになる情報をお持ちの方、ご提供ください。お願いします。

100:名無しさん@3周年
08/06/15 01:45:18 24FGz574
>>99
MP3エンコードし直したら?

101:名無しさん@3周年
08/06/15 16:27:06 nIbVhnH9
>>99
MP3のヘッダ情報に問題あるんじゃないかな?


102:名無しさん@3周年
08/06/15 19:01:03 CYqsgLmF
>>99
どういう素性のMP3ファイルかを書いた方が良いと思う。
なんていうソフトでエンコードしたか、とか。

103:名無しさん@3周年
08/06/19 23:12:03 al5Ydx5v
本体にデータを入れすぎたせいか、認識されなくなってしまいました。
本体データをリセットする方法はないでしょうか?

104:名無しさん@3周年
08/06/20 06:43:36 nlXh0YHL
>>103
俺も同じ現象 
本体が認識されない。
データを入れた過ぎたせいかと思ってデータはほとんど消したんだが認識されない。
どうすりゃいいんだろ?

105:名無しさん@3周年
08/06/20 14:54:22 XNxenCXw
>>104
SIIに聴いてみれば?
バグかもしれない。
それならファームウェアアップデートで対応してくれるでしょうから。

106:名無しさん@3周年
08/06/20 23:49:23 ci1kBQzN
>>103
>>104
「(本体が?)認識されない」ってどういう意味?

107:名無しさん@3周年
08/06/27 00:53:36 LyuSxW+5
epwing → DDwin →txt化 にするには、外字変換テーブルが無いと完全には駄目なのかな?

10000項目あるとして、10項目/分の速さでコピペしてったら、16時間もかかるぜ。

108:名無しさん@3周年
08/06/30 22:25:03 MecYnaBb
SL900XをパソコンとUSBでつないでMP3データを入れようとしたらエラーが出て、
それが原因でそれまで再生できたファイルが全部バグってしまいました。
辞書で本体データを見ても今までMP3だったものがフォルダの状態になっててファイル名が「uqvq〓〓〓.D8〓」になって5つ並んで削除もできず困ってます。
どうにか直らないでしょうか?

109:名無しさん@3周年
08/06/30 22:26:47 MecYnaBb
ちなみにUSB接続してパソコンで本体データを見てみるとそれまでなかったフォルダやファイルがいくつかあって、
それらの名前は全部文字化けしたような名前になってます。
削除しようと思ったんですがファイルサイズが妙に大きくて削除したら辞書が使えなくなるかと不安です。

うまくいえないんですがどなたか解決方法が分かる方情報提供お願いします。

110:名無しさん@3周年
08/06/30 23:21:33 JWG8+ani
>>108,>>109

うまく良くか分かりませんが、フォーマットはどうでしょう。

フォーマットの方法は、
マイコンピュータを開き、
電子辞書の記憶装置のアイコンを右クリックし、フォーマットをクリックする。

ファイルシステムは FATかFAT32を選んで、
ボリュームラベルは好きな文字を入力する
あとの項目はそのままで開始を押すとフォーマットが始まって完了するはず。

フォーマットが終われば、電子辞書の内部メモリに入ってたデータは全部消える。


この方法が駄目ならどうしようもないから修理に出すか、ファームウェアアップデートで解決されるのを待つかしかないと思う。





111:名無しさん@3周年
08/07/01 00:57:59 uiPI6cgG
ネットサービス】松下の電子書籍『ΣBookJp』『最強☆読書生活(PC版)』、
ひっそりとサービス終了へ [07/01]
スレリンク(bizplus板)

112:名無しさん@3周年
08/07/01 10:03:29 rhM4wDVZ
108です。

>>110

フォーマットしたら解決しました。こんなことに答えてくださって&丁寧な説明ありがとうございました。

113:名無しさん@3周年
08/07/12 22:13:59 YbBZ7n4a
これにはテキスト何件入れられる?
あと、フォルダ分けとか長いファイル名とか使えるのかな?

114:名無しさん@3周年
08/07/12 23:11:32 kGYPjr1W


115:名無しさん@3周年
08/07/26 00:04:05 2683oRR+
音声データをパソコンから移したけど
MP3プレーヤーの「本体データ」のとこに表示されなくて
再生できないのはなぜ!?
ファイル管理の「本体データ」のとこにはちゃんとあるのに…

116:名無しさん@3周年
08/07/26 00:23:10 VfAEnqAi
>>115
MP3プレーや起動した?

117:名無しさん@3周年
08/08/13 23:45:47 uZGDpoij
セイコーのSR E8500を使用しているのですが、
これ常にバックライトをONにできないものでしょうか?
おしえてください

118:名無しさん@3周年
08/08/14 18:41:43 6bnD+55b
>>117
自分も持ってるけど、常にONは出来ない。
現行のどの電子辞書も、電池の消耗を考えて常にONには出来ないようになってる。

119:名無しさん@3周年
08/08/14 20:09:04 jQOQy9gx
よくわからないけど、これってcsvから変換しないと駄目なの?
htmlからは無理?

120:名無しさん@3周年
08/08/14 20:28:08 8+iCpgOj
>>119
無理

121:名無しさん@3周年
08/08/14 21:05:43 OA7l9p0h
>>118
そうっすか、どの機種もむりですか。
画面みにくい。
例文検索、成句検索が非常に便利ですね。ほかの辞書でもあるんだろうか。
新型のセイコーは画面改善されてるのかな

122:名無しさん@3周年
08/08/14 21:43:04 6bnD+55b
>>121
新しいSIIのシリーズは電子辞書はVGAで高コントラストだよ。
電子辞書の中では最も解像度が高くて見やすいと思う。
その代わりバックライトが付いてないから、真っ暗な場所だと見えないけどね。
ただ、反射型液晶だから、あんまり暗いところで無い限りは大丈夫かな。
実際使ってる身としてはね。

123:名無しさん@3周年
08/08/14 22:25:09 w4SphixB
暗いところでは使わないしな。

124:名無しさん@3周年
08/08/16 01:23:38 IDrOvuNg
epwing -> tsvの変換ツール書いてる人いる?
誰も作らないなら自分で作ろうかと思うのだけど。

125:名無しさん@3周年
08/08/16 07:42:51 i+v4plnn
神現る

126:名無しさん@3周年
08/08/16 14:36:39 nvdjxStN
おねがしやーっす!

127:名無しさん@3周年
08/08/16 17:25:24 e5SezU1t
>>124
是非お願いします。

以前、部分的に作りかけたんだけど、途中でほったらかしです。
一応、御参考までに書いときますね。

(1) [EPWING] -> EBDump -> [EBDump出力ファイル] -> ebd2html -> [HTML]
が使えると想定して、これを独自形式のXMLにしてから、最終的にTVSにするという構想で以前作りかけた。
(2) [HTML] -> 独自ツール1 -> [独自形式XML] -> 独自ツール2 -> TVS
(3) TVS -> SIIのツール -> SII辞書
これで、Excelみたいなものがなくても出来る筈。XMLならスクリプト言語で操作し易いし、Excelの行数制限も回避できる。
ここで(2)の部分はWindows以外(UNIX上とか)でも処理できるし。

ExcelはCSVはShift_JISなのかな。TSVはUTF-16? 文字表現能力からTSVだけを相手にすることに決定。
(しかしSIIの電子辞書にはどういう文字のフォントが用意されてるんだろ?)
で、[独自形式XML]をでっち上げて、独自ツール2 をPerlで書いてみたんだけど、
ExcelのTSVやSIIのツールの仕様の詳細が分からなくて面倒になって中断したままだ。

SIIのサンプルだと、先頭の方にカラム定義みたいな行あがるけど、
これは、実際のデータの最大カラムに合わせて増減すればいいのか、とか、数字は全角じゃないといけないのかとか、、、。
ID 見出し語 ... 例文1 例文2 例文3 例文4 ...例文200
1セルの中の改行なんかの扱いにも疑問点があった様な気がする。


128:名無しさん@3周年
08/08/16 17:27:11 e5SezU1t
そのとき考えた[独自形式XML]はこんな感じ。
(0-n)みたいなのは、一つにentry中に存在可能な数。
entory中の記述の順序は自由。値のないnodeは省略可能。同じ種類のnode群の中では出現順序を保存。

<entry id="1">
<title>SII</title> <!-- 見出し語 (1) -->
<reading></reading> <!-- 表示用読み (1) -->
<title_key>SII</title_key> <!-- 見出し語検索用読み(かな、アルファベット) (1-n: when the entry has a keyword, this can be 0.) -->
<title_key>えすあいあい</title_key>
<keyword></keyword> <!-- キーワード検索用読み(かな、アルファベット) (0-n) -->
<body_text>セイコーインスツル株式会社の略称。</body_text> <!-- 本文 (1) -->
<ref_id>2</ref_id> <!-- 参照ID (0-n) -->
<sound></sound> <!-- 音声データ (0-n) -->
<picture></picture> <!-- ビットマップ (0-n) -->
<class level="0">会社</class> <!-- 大分類 (0-1) -->
<class level="1">日本</class> <!-- 中分類 (0-1) -->
<class level="2">略称</class> <!-- 小分類 (0-1) -->
<example></example> <!-- 例文 1-200 (0-n) -->
</entry>


129:名無しさん@3周年
08/08/16 17:27:54 e5SezU1t
別の例

<entry id="2">
<title>セイコーインスツル株式会社</title>
<reading>-かぶしきがいしゃ</reading>
<title_key>せいこーいんすつるかぶしきがいしゃ</title_key>
<keyword>エスアイアイ</keyword>
<keyword>せいこーいんすつるめんつ</keyword>
<body_text><L>事業内容</L>
【マイクロメカ】 ウオッチ、ウオッチムーブメント、超音波モータ、HDD部品など
【ネットワークコンポーネント】 液晶表示モジュール、CMOS IC、マイクロ電池、水晶振動子など
...、など</body_text>
<ref_id>3</ref_id>
<ref_id>4</ref_id>
<class level="0">会社</class>
<class level="1">日本</class>
<class level="2">千葉</class>
<example>Creating Time, Optimizing Time, Enriching Time.
時を創り 時を活かし 時を豊かに</example>
</entry>


130:名無しさん@3周年
08/08/16 17:35:30 e5SezU1t
で、これくらいの例は(XML->TSV)変換がだいたいできるものが動いてる。
>> 127 の 独自ツール2 に相当する部分。
(ただしUTF-8で処理してる。TSVにしてからUTF-16に変換が必要。)
クロスリファレンスも処理する、、、ようにした様な気がする。
XMLの時点ではidに文字列を書いておけば、TSVに変換する際に対応するもの同士を同じ数字に変換する。
作りかけだったかなあ?

あ、あと、「ID 見出し語 ... 例文1 例文2...」の行をどうするかとか、
改行を表す<N>の処理とかはまだだったかな。
そのあたり、前述のようにTSVやSIIのツールの詳細の確認が面倒なのでそれっきり。
Windowsを触りたくないってのが大きい。
そういう仕様がどこかに明記されてると助かるんだけど。

独自ツール1については何も作ってないけど、似た様な感じで作れるんじゃないかな。

131:124
08/08/16 18:57:08 IDrOvuNg
今日から作り始めました。

>>127
EPdumpのテキストダンプを直接tsvに変換するつもりです。
今はEPdumpの出力をパースする部分を書いています。

UTF-16が使えたんですね…、
Shift-JISで処理するように書いてしまいました…
とりあえずS-JISで作ってそのあとunicodeに対応させようかと。

カラム定義は、サンプルそのままコピーして、
例文200まで常に入れるようにしてます。

でも、epdumpの出力で、例文を判別できない(と思う、違ってたら誰か教えて)
ので、例文欄は使わない予定です。

132:127
08/08/16 21:18:37 e5SezU1t
>>131
> 今日から作り始めました。
おー。期待してます!
> UTF-16が使えたんですね…、
たしかExcelでテキスト形式に保存するとUTF-16のTSVが出来た様な、、、。
で、SIIのドキュメントにもそれで良さそうなことが書いてあった様な気が、、、。

> でも、epdumpの出力で、例文を判別できない(と思う、違ってたら誰か教えて)
> ので、例文欄は使わない予定です。
実はEBDumpもebd2htmlも全然見てもないんですが、以前、EBライブラリでEPWINGのデータを見たことはあります。
EPWINGのコンテンツって、構造というか意味を表現する様な機能はリンク以外無いんじゃないかと思います。
あとは文字スタイルや外字を直接指定しているくらい。
「ここから例文」と言うような情報は一般的には無いんじゃないかな。
なので、「この記号の後は例文」とか、「この文字列のあとは例文」とか、「コンテンツ毎に推測」するしか無いと思う。
それも、中間に「独自形式のXML」を用意しようと思った理由です。
「独自ツール1」の部分をコンテンツ毎に用意することでそういう場当たり的な処理に対処しようと。
>>127
> (2) [HTML] -> 独自ツール1 -> [独自形式XML] -> 独自ツール2 -> TSV

133:124
08/08/16 22:46:32 IDrOvuNg
>>132

> なので、「この記号の後は例文」とか、「この文字列のあとは例文」とか、「コンテンツ毎に推測」するしか無いと思う。
後で手持ちの辞書で調べてみます。

> それも、中間に「独自形式のXML」を用意しようと思った理由です。
うーん、そこまでは考えてませんでした。

まだ具体的には考えてないんですが、
変換ツール自体はCで書いているので、途中でPHP等の外部スクリプトを呼び出せば、
コンテンツ毎に処理できるかもしれないですね。

134:127
08/08/17 00:30:23 K3iBvO+l
そうですね。
なにかしらスクリプト言語的な小回りの効く部分があると良さそうな気はします。
まあ、でも、とにかく動くものを作っちゃってから、改めて改良すればいいんじゃないでしょうか。
(↑偉そうな言い方に見えたらすみません。途中で投げ出したへたれの言うことなのでお気になさらずに。)
例文検索できなくても、見出し語検索だけでもできればすごく嬉しいコンテンツもいっぱいありますし。
見通しが立ってくれば協力してくれる人も現れるかも。

135:名無しさん@3周年
08/08/17 10:38:51 sj1oFIPI
>>124

メーカーと出版社に通報済。おまえみたいな馬鹿がいるから
EPWINGを使わずに独自フォーマットにする辞書が増え、
使いにくくなる。

136:名無しさん@3周年
08/08/17 11:56:35 Aoe+qlTI
>> 134
> まあ、でも、とにかく動くものを作っちゃってから、改めて改良すればいいんじゃないでしょうか。
そうですね、そうします…。

>> 135
> メーカーと出版社に通報済。おまえみたいな馬鹿がいるから
EPWINGを使わずに独自フォーマットにする辞書が増え、
使いにくくなる。

うーん、epwingから変換するツールを作るのは問題なんでしょうか…。
結論が出るまで公開控えることにします。期待してくれたかたすみません…。

137:名無しさん@3周年
08/08/17 12:16:55 Aoe+qlTI
↑名前書き忘れました、124です。

138:名無しさん@3周年
08/08/17 14:41:47 aXSCde/Z
>>135
>EPWINGを使わずに独自フォーマットにする辞書が増え、
>使いにくくなる。

その理論だと通報したら余計に増えるんじゃないの(笑)。
頭大丈夫かね。

>>136
変換ツールが法に触れるわけでもないし、気にしなくていいでしょ。
そもそも特定の辞書の話もしていないのにどこの出版社に通報したと言うんだろうね。

139:名無しさん@3周年
08/08/17 15:12:52 K3iBvO+l
JIS X4081規格のデータを処理するツールってことでいいんじゃない?
この人は、SIIの辞書が便利になると困るって人なんじゃないかな。

140:124
08/08/17 16:04:32 Aoe+qlTI
>>138
> 変換ツールが法に触れるわけでもないし、気にしなくていいでしょ。
今日は>>135見てから法律調べてるんですが、難しいですね…。

>>139
> JIS X4081規格のデータを処理するツールってことでいいんじゃない?
もちろん、JIS規格のデータを処理してるだけですが、

ユーザーが、他人に著作権のあるデータを処理したときに、
私的改変となり、その適法性が問題になり、もしこれが違法と判断されれば、
ツール作者が著作権法違反幇助ということですよね。

法律に詳しいわけではないので、
おかしなこと言ってたらどんどん教えてください。

とりあえず完成させないと話にならないので、続きやります。
作る分には問題ないでしょうから。

141:124
08/08/17 16:16:08 Aoe+qlTI
ちなみに個人的には、
実際出来るかどうかは別として、項目数の制限がなさそうなので、
wikipediaをepwing化して電子辞書に入れようと試しています。

数日前にDDwinのエディタ起動で出力されたwikipediaをtsvにして、
SIIのツールで変換しようとしたら、読み込んでも、変換中にツールが落ちたり、
HDD容量は空いているはずなのに、変換しようとした瞬間に、
「HDD空き容量が足りない」と出たり、うまくいきませんでしたが。

「HDD空き容量が足りない」については、
Excelで適当に作った70MBほどのデータでも出たので、
今、SIIに問い合わせ中です。

epwingからの変換ツールを作ろうとしたきっかけは、
DDwinの出力ではリンク情報が取り出せないので、
epwingから直接変換しようと思ったことだったりします。

142:名無しさん@3周年
08/08/17 17:53:18 K3iBvO+l
SIIの「ユーザー辞書の作りかた」のP.19にある「制限事項」に引っかかってるとか?
「本文 最大4,000文字(半角)」は、Wikipediaなんかのテキストを扱おうとすると簡単に超えてしまう。
複数エントリに自分で分けてやらないといけない。
DDWinはそういうことしてくれるのかな。

ちなみに、この4,000文字っての、文字コードを書いてくれないと意味不明。
ソーステキストはShift_JISだったりUTF-16だったりするんだから。
4KBってことだと思うけど、どういう表現の状態で4KBなのかが分からない。

143:名無しさん@3周年
08/08/17 18:02:34 QJxP1sDz
日本語で2000文字か・・・。

144:124
08/08/17 18:27:03 Aoe+qlTI
>>142

> 「本文 最大4,000文字(半角)」は、Wikipediaなんかのテキストを扱おうとすると簡単に超えてしまう。
> 複数エントリに自分で分けてやらないといけない。
wikipedia->tsvの変換の時に分けました。

ちなみに、4000文字超えた場合、tsvからSIIの辞書形式に変換するときにエラーがでて、
そのまま続行すると、辞書の見出し検索に出ないエントリが出来たりするようです。

> 4KBってことだと思うけど、どういう表現の状態で4KBなのかが分からない。
これは私も分かりません。unicodeにするときは調べないとダメですね。

145:名無しさん@3周年
08/08/19 23:43:13 iEz7AlOp
ちゃんとコンテンツを購入した人の利便性があがる環境が整えば、
EPWINGは、また売れるようになるんじゃないかな。
だけど、CCCDと同じ道を歩んじゃったんだね。残念。

146:名無しさん@3周年
08/08/20 11:09:16 +D150fAd
EPWINGを他形式に変換するスクリプトなんて
いろんな人が出してるよ。
>>124も無問題

147:124
08/08/21 15:12:33 rracus5P
もう大部分は出来てるんですが、細かい部分をもう少し直します。
もうしばらく掛かりそうですが、8月中にはどうにかします。

>>146
結局何も問題ないみたいで良かったです。

148:名無しさん@3周年
08/08/21 22:04:57 n0KuhNZR
頑張ってくらはい。 期待しているでごじゃる。

149:名無しさん@3周年
08/08/23 22:49:49 fqyAQtq6
SL900Xが届いたので、ユーザー辞書DUO3.0を作った。
ユーザー辞書からもジャンプできるので、使ってて楽しいね。

150:名無しさん@3周年
08/08/23 22:57:56 VgA3jX/A
>>149
そんなことできるんだ。

151:名無しさん@3周年
08/08/25 10:44:31 BrCkwjI5
テキストと音声が連携する環境が作れるね
スゴイなこれ

152:名無しさん@3周年
08/08/25 23:06:26 V9Q0Z6yM
SVLの12000語単語辞書を半日くらいかけて作ってみた。
見出し語、簡単な訳、それとSVLのレベル程度を自作辞書に入力しとけば
単語の音声や詳細な意味はオリジナル辞書から引っぱれる。
逆に未知の単語からSVLのレベルを検索することも可能。
うまく説明できないけど、この辞書スゴイよ。

153:名無しさん@3周年
08/08/26 00:41:26 hETmnOsj
>>152
ヘーそんなの出来るんだ。欲しくなってきた

154:名無しさん@3周年
08/08/26 01:55:33 ZXhYA0Qz
svlってなに?

155:名無しさん@3周年
08/08/26 07:35:15 YzoAEE/b
>>154
「標準語彙水準12000」(SVL=Standard Vocabulary List)は、過去30年にわたり、多数の学習教材・書籍を通じて、
英語学習者の皆さんをサポートしてきたアルクが、その過程で蓄積してきたさまざまな英文データと、
多数の貴重な選考資料をもとに、日本人の英語学習者にとって有用であると思われる英語語彙1万2000語を選び出し、
それを基礎から上級へと12のレベルに区分した段階別学習語彙リストです。

156:名無しさん@3周年
08/08/26 18:59:59 ZXhYA0Qz
>>152
shareに流してちょー

157:名無しさん@3周年
08/08/26 19:16:53 SAY/dUUB
>>156
流した側が犯罪者になりますが

158:名無しさん@3周年
08/08/30 02:13:43 WyfP8p80
このメーカーは今でも検索機能はナンバーワンですか?
他メーカーもかなり充実してきてるようなのですが

159:名無しさん@3周年
08/08/30 07:56:45 Bqcol4XL
>>158
今ある辞書の中では最高の検索機能ですよ。
操作周りもやはり一番使いやすいです。

160:名無しさん@3周年
08/08/30 10:31:56 Bjy/0gF6
>>158
他メーカーは検索機能に関しては全く進歩してないよ

161:名無しさん@3周年
08/08/31 12:14:37 tFxvsmUn
さっき道歩いてたら>>1がキモい顔して近寄ってきたでまじムッカついてボコボコにしたら
鼻血でて眼鏡とんで前歯折れて「あがああ!まえば!おれた」て叫んでうざかったで
口に牛肉ねじこんだら「んごごごごご」とか呻いてたでオメガ便器に顔突っ込んだら
鼻血まみれで「ばぶう」とか言ってて超絶笑えたでとどめにしねバーカとか罵声あびしたったwwwww
>>1悲惨wwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

162:124
08/08/31 18:26:18 pSCMEZgI
epwing -> tsv変換ツール、
どのくらい需要あるか分かりませんけど、現時点版をとりあえずupしました。
でもまだ中途半端ですね…。
URLリンク(ameblo.jp)

163:名無しさん@3周年
08/08/31 18:28:24 y8UCpWeS
>>162
サンクス
とりあえずテストしてみるわ

164:名無しさん@3周年
08/08/31 18:32:03 y8UCpWeS
>>162
アメブロからの直リンでDLファイル指定するとDL出来ないっぽい

165:124
08/08/31 18:36:32 pSCMEZgI
>>164
すみません、、気づきませんでした。
とりあえず直リンは消しました。

166:名無しさん@3周年
08/08/31 19:17:56 y8UCpWeS
>>162
URLリンク(maximilky.hp.infoseek.co.jp)の人名辞典を変換してみた。
00と90のみを使った場合を作ってみたが、基本的に大丈夫そう。
S9000に入れて使ってみているが問題はなさそう。
なかなか良くできてると思う。感謝

ただ、vistaで使えないようだ。XPではできたけど。

167:124
08/08/31 19:33:21 pSCMEZgI
>>166
報告どうもです。
うまく動いたみたいで良かったです。
時間が空いたらもう少し直してまたupしますね。

vistaは持ってないんですよね、、
とりあえずvistaは動かないって書いときます。

168:名無しさん@3周年
08/08/31 19:56:16 y8UCpWeS
>>167
もしかしたら特定の環境でだけ使えないと言うこともあるかと
うちのvistaで出るエラーは

このアプリケーションのサイド バイ サイド構成が正しくないため、アプリケーションを
開始できませんでした。詳細については、アプリケーションのイベント ログを参照して
ください。

169:名無しさん@3周年
08/08/31 20:06:17 pSCMEZgI
>>168
どうなんでしょう。
サイド バイ サイド構成なんて初めて聞きました。

ちょっと調べてみたんですが????な状態です。
今のところはvistaは動作未確認ですね。

170:名無しさん@3周年
08/08/31 20:10:43 y8UCpWeS
>>169
とりあえずは「vistaは動作未確認」とだけ書いておいて、
使えたかどうかをここやブログに書いて貰えばいいでしょう。

たまたま俺の環境でダメだっただけかもしれませんので。

URLリンク(siidict.net) で紹介してもいいぐらいの出来だと思います。

今からちょっと大きめのファイルにも挑戦してみようかと思ってます。
あとで報告に来ますので

171:124
08/08/31 20:28:42 pSCMEZgI
>>170
vista動作未確認にしておきました。

wikiに書くには、個人的にはもう少しクオリティ上げないといけないなぁと思っています。

今の状態では見出しが重複することがあるので、それを直さないと…。
時間見つけて来週中ぐらいには直しますね。

報告よろしくです。

172:124
08/08/31 20:45:01 pSCMEZgI
>>170
連投すみません。
vista対応かもしれないテスト版をupしました。

よろしければテストしていただけませんか?

173:名無しさん@3周年
08/08/31 20:55:00 y8UCpWeS
>>172
vistaで使えるようになりました!

174:124
08/08/31 21:00:17 pSCMEZgI
>>173
おー良かった良かった。

vistaにランタイムがなかったみたいです。実行ファイルにスタティックリンクしました。
ファイルサイズわずかに増えましたけど今の時代気にならないのでこっちを正式版にしますね。

175:名無しさん@3周年
08/08/31 21:54:15 cjlMaIRe
124を主要EPWING辞書出版社に通報しますた。あんた、もし他社のEPWING辞書をセイコーの辞書形式に
変換する奴が出てきて出版社から訴えられたらたらどうするんだ?
違法コピーする奴だけでなく、違法コピーを助長させるツールを作る奴も
責任問われるのはWINNYの例を見れば分かるだろ? 個人で作って使うだけなら
何も問題ないことでも、公開したらどうなるかってことぐらい分からんか?

176:名無しさん@3周年
08/08/31 21:57:38 y8UCpWeS
>>175
またでた。
それなら長く息の続いてる
URLリンク(maximilky.hp.infoseek.co.jp)のようなフリー素材をepwingにした物や、
URLリンク(www31.ocn.ne.jp)のようなディスク辞書変換スクリプトなんかはどうなるんだろな。

EPWING形式自体を個人で作り上げることが出来る以上、
それを変換するスクリプトも問題はない。

177:名無しさん@3周年
08/08/31 22:03:15 y8UCpWeS
>>175の理論だと、
ビデオエンコーダーや、コピー機なんかも違法なんだがな。
youtubeで落とした動画を変換する・・・とかね。
使用が個人の範囲であれば、変換するツールも問題ない。

違法コピーを助長って、それはP2Pがあっての話。
別に124を使うことによって、他人にコピーが渡ることはない。
もちろん変換したデータをP2Pで流せば流した奴は違法になるが。

しかも、最近はEPWINGじゃない形式で出してたりするところも多いから、
今更EPWINGの対策に本腰入れては取りかからないだろな。

178:名無しさん@3周年
08/08/31 22:14:37 llMgMzUY
というか>>175の論理って結局どういうこと?

EPWING形式だろうがtsv形式だろうが、P2Pで違法に流される危険性は全く変わらない。
というかtsvの方がSIIの電子辞書を持っている人しか使えないんだから、むしろ流れても使われる機会は少ない。

EPWINGの辞書を出している出版社にとっては、SIIの電子辞書で使いたいユーザーによって売上も上がる。


出版社にとっての不利益って皆無だよな?

179:名無しさん@3周年
08/08/31 22:18:23 9e8zjTAc
なんでもかんでも著作権侵害幇助にあたると思ってる人がいるんだね
まぁ、訳分からない通報は笑いものになるだけで、
大した実害は無いかな

180:名無しさん@3周年
08/08/31 22:21:32 y8UCpWeS
>>178
結局SIIが便利になると困る人がいるんでしょう。

変換する奴が出てくる→違法コピー
っていうつながりが分からんのだよね。
違法コピーで流れるとすれば、それは変換した奴がP2Pを使うから。
別に124は関係ない

181:175
08/08/31 22:29:47 cjlMaIRe
出版社はけっこう敏感だよ。某出版社やソフトハウスが自社の辞書の変換ツールを
公開した人に、即刻公開中止を要求したこともあったでしょ。作るのは124の自由。
使うのも124の自己責任。しかしそれを公開する以上、124には責任が生じる。
124はその覚悟を持って公開しているのなら、好きにすればいいんじゃない?

182:名無しさん@3周年
08/08/31 22:39:28 y8UCpWeS
>>181
だ・か・ら
EPWINGは辞書の形式としてはかなりメジャーだし、
ファイルは個人でも作れる。

そりゃね、めちゃめちゃプロテクトのかかったファイルを変換されるとまずいんだろうけど、
一般的に広まってるファイル形式を変換されようが仕方のないこと。

URLリンク(www.sra.co.jp)
はフリーの規格だけど、
これを変換するだけのスクリプトなら何ら問題ないのは分かるはず。

ちなみにEPWINGはJIS規格
EPWINGフォーマットは1996年にJIS X4081「日本語電子出版検索データ構造」というJIS規格に制定され
URLリンク(www.epwing.or.jp)

ただのJIS規格

183:名無しさん@3周年
08/08/31 23:28:37 llMgMzUY
>>175
EPWING→独自形式

独自形式→EPWING
では事情が違うということが理解出来ないようだな。

184:名無しさん@3周年
08/09/01 02:12:32 CL874oEX
現実はP2Pでソフト流れてる企業がメジャーになるんだけどな
casioのカードデータなんて流れはじめたらもうcasioの独占状態だろうな

電子辞書持ってないから形式とかよくわからんけど

185:124
08/09/01 07:26:24 plo6Wr2k
>>175
公開の是非について>>135-146あたりで問題になったときに、
私は法律の専門家ではありませんが、公開しても問題ないと判断した理由は、

1. >>182の言うように、
JIS規格を利用してるだけ。
広く公開されてる規格だし、別にプロテクトは一切掛かっていない。

2. >>177の言うように、
音楽動画の変換ツールが問題ないならepwing2tsvも問題ない。
結局、同じようなことしてるだけ。

と考えたからです。
この程度のツールで違法と判断されるなら、
世の中のツールの大部分は違法になってしまうと思います。
もし本当に違法であるなら、そのうち出版社のほうからコンタクトがあるでしょう。

186:名無しさん@3周年
08/09/01 08:36:26 hdPfRhM3
>>185
ほっておけばいいよ。>>175は個人的に気に入らないだけだろ。

187:名無しさん@3周年
08/09/01 10:24:33 hdPfRhM3
>>166
実行中に落ちてしまいます

C:\epwing2tsv>epwing2tsv 1 2 3 4
processing file 0x00... done.
processing file 0x81... done.
processing file 0x90... done.
processing file 0x91... done.

ちなみに 00 と 90 だけでも無理でした

環境は OS:XP home メモリ:512   CPU:pentium4 古い方
です

EBdump の設定を誤っているのかも知れないので、設定内容を教えてもらえませんか。




188:187
08/09/01 10:33:13 hdPfRhM3
ごめんなさい。>>187です。出来ました。
やはりEBDumpの設定を間違っていました・・

189:名無しさん@3周年
08/09/01 12:20:40 hdPfRhM3
読みに記号や漢字が入るとその行は全部飛ばされちゃう・・
その辺りは本家ソフト側でどうにかして欲しいな


それにしてもすごいソフトですね。
作者様に感謝します

190:名無しさん@3周年
08/09/01 13:25:35 MLRisyeS
やっぱ、ROMってるやつ結構いたんだね。
同じ機種持ち仲間がいて嬉しい。

191:名無しさん@3周年
08/09/01 17:20:55 o+Paly1b
124さん
>>141で問題になっている、空き容量が足りませんの問題ですが、
何かSIIから返信はありましたか?
僕は重めの(100MBちょっと)のやつを変換しようとしたら出ました。
もちろんHDDは十分に空いていたのですが。
10MB程度のファイルなら出ないようでした。

192:124
08/09/01 19:49:16 aY+Py2+Y
>>191
8月20日に現在確認中との連絡を受けました。
今は次の連絡を待っています。

193:名無しさん@3周年
08/09/01 22:55:14 KRBFQLdb
SL900X買ってきた
これで辞書作りに参加できる!


194:名無しさん@3周年
08/09/01 23:34:22 hdPfRhM3
>>193
いいねぇ!

195:名無しさん@3周年
08/09/02 00:50:53 +zlQExtr
やっとwikipediaをepwing化したところまで来た

SL900XのSDカードって、
2Gが上限なんだね
>>192が解決できても、wikipediaはちょっと苦しい?

2GSDカードってもうすぐ市場から消えてしまうような気もするし、
(今日750円で買った)
辞書用にいくつか買い置きしておいた方がいいかなぁ


196:124
08/09/02 02:39:58 8ckPV3+0
>>195
tsv変換すると、1.4Gぐらいで、
SIIのツールで変換するとサイズがさらに小さくなるようなので、
2Gあれば問題ないと考えています。

空き容量不足以外にもまだwikipediaを変換するには問題が…。

・見出し重複→今週中に直します。
・読み変換→すでに不完全ながら実装はしたのですが、
    数字記号などの問題があるのでもう少し時間が掛かりそうです。

空き容量不足エラーについて、
約700Mのデータでエラーが出ないファイルもありました。
(データチェック中に、何も表示されずに落ちた)
単にファイルサイズの問題ではないようです。

197:124
08/09/02 05:18:36 8ckPV3+0
>>196でデータチェック中になにも表示されずに落ちた原因は、
以前DDwinの一行テキストを変換したデータだったので、
" -> ""の変換をしていなかったことでした。(epwing2tsvでは変換しています)

1つの「"」を辞書で表示するには、2つ「"」が必要なようです。

データチェックが終わり、「エラー項目の確認」ダイアログが表示されたので、
未実験ですがこの後の変換もうまくいくと思います。

198:124
08/09/02 15:57:20 Ay1IY5Hb
>>197の続きの変換をやってみたのですが、
何度試しても変換中に落ちてしまいました。

で、ファイルを半分に分けて小さくしてから変換しようとしたら、
また、「HDD空き容量が足りません」、と。

以上報告のみ。

199:名無しさん@3周年
08/09/02 18:33:15 ZowZzHm7
wikiとかバカでっかいもの入れたら検索するときウザくない?

200:名無しさん@3周年
08/09/02 19:09:22 +zlQExtr
epwing→tsvじゃなくても、
html→tsv(EBStudio入力用)やxml(freepwing入力用)→tsvが出来れば、
使える電子辞書増えそうだね

201:124
08/09/02 21:26:49 bh08Ujnk
>>199
遅くなるのは間違いないと思いますが、
実際にどれだけ遅くなるかはまだわかりません。
私は、ウザいと思ったら一時的にカード検索OFFにしようと考えています。

>>200
epwing介さず変換できたら便利ですね。
SIIの新機種にも自作辞書の機能が搭載されているみたいですね。
ユーザー数増えていろんなツールが出てくれればいいんですが…。

202:名無しさん@3周年
08/09/02 21:55:33 w8Qfqcnd
次スレは「SII 自作辞書スレ」だね

203:名無しさん@3周年
08/09/02 21:56:21 In+aBRlB

質問させていただきます。

ebdumpで、epwingのhonmonファイルを開き、出力ファイルは、「メモ帳で開く」チェックをはずすし、
記述子 1 で、デキストダンプをクリックしました。そしたら、「ログを作成しました」と表示されました。

そのあと、どうやれば良いのか、わかりません

ホームページを拝見して行ったのですが、普段、ネットくらいしかしないので、最初の「EBdumpのテキストダンプ(記述子)の出力を、
epwing2tsv.exe out1.txt out2.txt out3.txt ...」で早くも意味がわかりませんでした。




たぶん、コマンドプロンプトから操作すると思うのですが、具体的な手順を教えていただけないんでしょうか。

コマンドプロンプトの操作は、C:\epwing2tsv を入力する場所の指定くらいしかわかりません。


使用環境のpcは、xp メモリ 1 gb 、CPU:pentium4 古い方 です。

204:名無しさん@3周年
08/09/02 21:58:03 +zlQExtr
SIIの辞書作成ツール、
詳しい仕様が分からないから手探りで試してる
唯一の情報のpdfが中途半端に一般向けで、
かえって訳分からなくなってるのが残念

205:名無しさん@3周年
08/09/02 22:38:36 +zlQExtr
>>203
出力の仕方はこんな感じ?
(今日初めて使ったから間違っているかも)
 ①honmonファイルの指定
 ②書籍構成要素で[00]本文[90]前方一致かなINDEX[91]前方一致表記形INDEX等を選択
 ③出力ブロック数の設定
 ④出力ファイル名指定
 ⑤テキストダンプ実行

epwing2tsv.exeの使い方は、
例えば、書籍構成要素00,90,91の出力ファイルを00.txt,90.txt,91.txtとすると、
出力ファイルをepwing2tsv.exeと同じフォルダーに入れ、
コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動し、
 epwing2tsvexe 00.txt 90.txt 91.txt
これでoutput.txtがそのディレクトリーに作られるはず

206:名無しさん@3周年
08/09/02 23:16:42 +zlQExtr
変換ツール制限事項(pdfから)

凡例               .|  1つのユーザー辞書ファイル毎に最大半角4000文字
初期画面           .|  640*289モノクロまたは4ビットbmpグレースケールデータ
マーク             .|  16*48,24*72,32*96,48*144(横*縦)ピクセルのモノクロデータ
メニュー表示位置      .|  最大半角16文字
ID               ...|  数字のみ
見出し語          ......|  最大半角256文字
表示用読み         ...|  最大半角256文字
見出し語検索用読み   .....|  1つの読み毎に最大半角150文字。1つのセル内に最大半角4000文字
キーワード検索用読み  .....|  1つの読み毎に最大半角150文字。1つのセル内に最大半角4000文字
本文               .|  最大半角4000文字
参照ID              |  数字のみ
音声データ         .....|  1つのユーザー辞書ファイル毎に最大4,000,000ファイル
ビットマップ           .|  最大640*1500(横*縦)。1つのユーザー辞書ファイル毎に最大65,000ファイル
大分類、中分類、小分類  |  各分類毎に最大3000見出し語
例文               .|  1つのユーザー辞書ファイル毎に最大100,000

207:名無しさん@3周年
08/09/02 23:32:55 In+aBRlB
>>205

ご回答ありがとうございました。

ebdump の所で、②の説明たすかりました。
「00 本文 」「90 前文一致かなindex」「91 前文一致形index」をの3つの選択できていませんでした。
一つつづ選択して、00 90 91 の3つのtextファイルができました。

③に関しては、出力ブロック数 1 のままで実行しました。
④は、テキストダンプ実行後に、メモ帳が出て「名前をつけて入力」で、それぞれ名前を、00 91 90 としました。

epwing2tsv.exeの使い方で

windows xp (c)の場所で、新規ファイルをつくって、その中にepwing2tsv.exeをそのフォルダーに入れました。
同じように、作成された、それぞれ3つの 00 90 91 textファイルを、そのフォルダに入れました。

コマンドプロンプトで、epwing2tsvのあるディレクトリーに移動の場所を指定すると、epw2tsv sourcefile ・・・ となります。

どうも、ディレクトリへ移動できてないみたいです。場所は、プロパティで確認しているので、間違いないのですが。。。

しかし、もう少しで、できそうです。

本当に、ご回答ありがとうございました。


208:名無しさん@3周年
08/09/03 01:58:41 A/kYdDSe
E-DICを変換しようとすると、
「見出し語検索用読み(かな、アルファベット)」の項目に漢字も入って、
SIIツールでエラー出てしまう・・・

他にも色々エラーの元あって、
辞書毎にかなり個別対応しないといけないみたい

209:名無しさん@3周年
08/09/03 03:01:10 A/kYdDSe
三省堂の模範六法2008を変換しようとしたら、
見出し語検索用の読みがなが一切無く、
当然ほぼ全行エラーでどうにもならない感じ

SIIツールでは、見出し語検索出来ない辞書は作れないのかなぁ
リンクたどってみるだけでも十分使いものになるんだけど

210:名無しさん@3周年
08/09/03 04:02:38 A/kYdDSe
SDカードのファイルは、
本体のファイル管理機能で削除できないんだね
本体メモリー領域のファイルは削除できるけど

テキスト閲覧機能も、拡張子がtxtじゃないと見れないのかな
.htmlファイルはファイル名表示されなかった

211:名無しさん@3周年
08/09/03 04:32:05 A/kYdDSe
デジカメにSDカードロックして入れたら、
書き込み・削除共に出来なかった
ロック解除したらフォーマットもできた

SL900Xにロックして入れたら、
書き込みできた
ロック解除しても、何も変わらなかった

微妙な機能だなぁ・・・

212:124
08/09/03 05:34:43 i85nf+ht
>>207
出力ブロック数は、各項目(00: 本文など)のblksに書いてあるブロック数に合わせてください。
epwing2tsv sourcefile ...は書式を出力したつもりなのですが、分かりにくいですね。
次更新のときに少し変えます。

>>209
tsvで「見出し読み」を空にしておけば見出し検索できないエントリが出来るようです。
同様にキーワード読みを空にしておけばキーワード検索できません。
excelなどで消してみるといいかもしれません。リンク、辞書の「次見出し、前見出し」で飛べます。

213:名無しさん@3周年
08/09/03 21:57:01 RP1qUwkh
ヤクザがエグザイルのマネをしてコンサート?・・・893ILE 誕生日コンサート映像
URLリンク(video.nifty.com)

214:名無しさん@3周年
08/09/04 00:27:03 nImdZRWp
E-DICの例文の一部を変換しました
見出し検索語の漢字部分を削ったらエラー無く成功

215:名無しさん@3周年
08/09/04 00:39:11 BYS1TZT/
Amazon Kindle 的な機能も取り入れちゃえばいいのにね
ブレークするのでは?

216:名無しさん@3周年
08/09/04 01:54:50 nImdZRWp
epwing閲覧機能が付けばブレーク・・・

E-DICは4000字制限にかかる項目がかなりある
例文として分割すればいいかな
「○」が区切りに使えそう

217:名無しさん@3周年
08/09/04 02:15:24 FSgddffa
ebdumpで、00 91 90 のtextファイル出力が完了。
出力ファイルをepwing2tsv.exeと同じ新規フォルダーに入れる。
コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動。

epw2tsv sourcefile ・・・

epwing2tsv.exe 00.txt 90.txt 91.txt を入力

unable to open source file : 00.text と表示されます。

考えられる原因は、何でしょうか? 

os xp で、pentium4 です。

パソコンは、ネットしかしません。epwing2tsv.exe と ebdump と epwing 以外に何か準備する必要あるのでしょうか。 

218:名無しさん@3周年
08/09/04 02:22:10 nImdZRWp
>>217
それだけでいけるはずです
(自分はそれで上手くいってるので)

下の表示(unable to...)はエラー表示のコピペそのままでしょうか
そうだとしたら、拡張子txtをtextに打ち間違えただけかな?
そうじゃないなら、何が原因だろう・・・


219:名無しさん@3周年
08/09/04 05:13:44 nImdZRWp
「本文」欄に入れた英文は、
例文検索でかからないみたい
例文じゃないから当然なのかな?

220:124
08/09/04 05:53:55 pvbjSJ0/
>>216
そういえば4000字制限の分割方法も修正しないといけないですね。
英語単語の途中でも関係なしに切ってしまいます。
例文欄については辞書ごとに違うのでどうするかまだ考えていません。

>>217
>>218さんの言うとおり打ち間違いだと思います。
確認してみてください。

>>219
たぶんそういうことなのでしょう。

221:名無しさん@3周年
08/09/04 16:03:27 hmGuOEDt
ひきつづき 217 です

>>218 220 返事ありがとうございます

unable to open source file : 00.txt と表示されます。text は 掲示板への自分の記入ミスでした。

とりあえず、自分の全工程を記入しますので、何かミスに気がつきましたら、どなたかアドバイスください


ebdumpの内容 

①honmonファイルの指定
②書籍構成要素で[00] [90] [91] を選択
③[00] [90] [91]を選択したときの、blks= aaaa の数値を 出力ブロック数(N)に設定
④出力ファイル名を、00 90 91 に指定
⑤記述子(1)で、テキストダンプ実行

00 90 91 txt ファイルの完成

①~⑤まで以外の、設定が必要でしょうか。もしかしたら、infoblock の数も設定が必要でしょうか。

新規ファイルに、00 90 91 txt と epwing2tsv.exe と headerというやつを入れました。

コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動。

epw2tsv sourcefile ・・・

epwing2tsv.exe 00.txt 90.txt 91.txt を入力

unable to open source file : 00.txt と表示されます。

以上に、なります。よろしく、お願いします。

222:124
08/09/04 20:11:13 uEzbZr/A
>>221
④の出力ファイル指定のところで、拡張子(=.txt)が抜けていると思います。
省略して書いているだけかもしれませんが、それ以外に原因が思い浮かびません。


ちなみに今日は、SIIのツールで大きなファイルが変換できない原因が分かりました。
今からSIIに連絡してきます。

223:名無しさん@3周年
08/09/04 20:20:08 /6MVihz4
>>222
おお!原因分かったんですか!すごいですね。

>>221
ファイル名が誤っているんだと思いますよ。
ウィンドウズの設定で、ファイルの拡張子を表示するように設定して、ファイル名の確認をしてみたらどうでしょう。

224:名無しさん@3周年
08/09/04 20:46:52 hmGuOEDt
>> 222 223 返事ありがとうございます。

ご指摘の拡張子のチェックしました。.txt と表示されました。

とりあえず、パソコンを変えてやってみることにします。

ながながとお付き合いください、ありがとうございました。

225:名無しさん@3周年
08/09/04 21:29:22 hmGuOEDt
224です 

進展ありました。
新規ファイルへの移動が、うまくできていませんでした。

今度は、ファイルへ移動してから、epwing2tsv.exe 00.txt 90.txt 91.txt 入力。

processing file 0x00 ... error. と表示された後、その新規ファイル内に
二つのtit.tmp ファイル body.tmp ファイルが作成されました。

う~ん。。。。なぜだろう。。。。



226:124
08/09/04 22:06:31 uEzbZr/A
>>225
tmpファイル類は、メモリに置かなくても済むように一時的に作成しています。

とりあえず、error表示の後に、
echo %errorlevel%
を実行して表示された番号を教えてください。
プログラムを見直しましたが、2と出ているはずです。

だとすれば、<4RBL>や、<何か>などのような、
半角<>に囲まれた十六進数でない内容がファイルに含まれているのだと思います。

EPWINGでは、本文の内容の半角文字は全角化されて格納されていると思うのですが、
そうでない場合もあるのでしょうか…。それとも文字コードの問題かな…。

たぶんepwing2tsvのバグだと思うので近いうちに直します。


227:名無しさん@3周年
08/09/04 22:16:41 hmGuOEDt
>>> 226

error の後、echo %errorlevel% と入力で、ご指摘のとおり 2 と表示されました。

自分は、パソコンの知識はないので、これ以上はファイルの修正できそうにないです。

それにしても、すばらしいソフトです。

何度もお騒がせいたしました。


228:124
08/09/04 22:44:01 uEzbZr/A
エラーを詳しく表示するようにしてをupしましたので、
時間があるときにでも実行してみてもらえますか?

私は朝早いので今日はもう寝ます。おやすみなさい。

229:名無しさん@3周年
08/09/04 23:10:05 hmGuOEDt
>>228 たびたびのご返事ありがとうございます。

エラーの詳細がでました。

epwing2tsv.exe 00.txt 90.txt 91.txt
row 2706: error converting hex <BL$H>
error.

自分の質問ばかりで、すみません。。。

230:名無しさん@3周年
08/09/05 14:17:27 ARx65l5T
00000321 行目 例文に空白があります。
00000321 行目 本文がありません。
00000358 行目 不正なタグがあります。

みたいなエラーが出るのだけど、
その部分だけ抜き出して変換するとエラーにならない・・・
SII提供ツールに色々問題ありそう


231:名無しさん@3周年
08/09/05 15:40:48 ig0ck/rv
>>230
変換ツールは融通が利かないからなぁ


232:名無しさん@3周年
08/09/05 15:59:43 eYw2RsmO
SIIさん、がんばってくらはいよ~
自作辞書は業界ではタブー的な位置で微妙かもわからないけど、なんか作ってくらはいよ~。


233:名無しさん@3周年
08/09/05 19:40:28 7QtJobt6
>>229
epwingの内容に意味不明なタグ(っぽいもの)が紛れ込んでいるみたいですね。
とりあえず、意味不明なタグは解釈しないでそのまま出力するように明日中には変更します。

234:名無しさん@3周年
08/09/05 23:08:39 ARx65l5T
エラーが出ても辞書作成できたので使ってみたら、
改行やタブがちゃんと認識されていない箇所続出
一部がソースのままデータになっていたりする
SIIはツールのバグ直してくれるのかなぁ


235:名無しさん@3周年
08/09/05 23:17:46 ARx65l5T
ソースに「"」を一つ付けだだけで挙動が劇的に変わった
どうなってるんだか・・・


236:名無しさん@3周年
08/09/05 23:23:50 ARx65l5T
「"」が対になっていないとエラー引き起こす?
全部対にしたらエラー消えた


237:名無しさん@3周年
08/09/05 23:28:10 ARx65l5T
「"」で消えたのは、
  00000028 行目 各項目は最大4,000文字です。
というタイプのエラーのみ


238:124
08/09/05 23:59:30 7QtJobt6
>>237
epwing2tsvで変換して、
その後エディタで、「"」 -> 「""」
と変換したということですか?

もしそうなら、epwing2tsvのバグでもあります。
””変換は実装したはずですから。

239:名無しさん@3周年
08/09/06 00:34:55 vX1uwmCK
>>238
epwing2tsvは正常に動作しています。

その後、txtファイルをexcelで読み込んで書き出して・・・とやっている間に、
"が""""""みたいになっていき、
その部分を手動集成している内に"がエラー状態になっていました。

excelは他にも色々問題ありますね・・・
txt読み込み時に;を区切りにしても、
たまに区切ってくれなかったりとか

240:名無しさん@3周年
08/09/06 00:52:22 vX1uwmCK
やっと、E-DICの例文を変換できた!


241:名無しさん@3周年
08/09/06 00:57:04 gTwDy34l
>>232
> SIIさん、がんばってくらはいよ~
SIIさん、Macもよろしくおねがいします!
入力ファイルがXMLもありだったりするとさらに嬉しいです。

242:124
08/09/06 01:18:02 HtUug95j
>>239>>240
バグではなかったようで安心しました。
うまく出来たようでよかったですね。

243:名無しさん@3周年
08/09/06 01:40:13 vX1uwmCK
別の辞書の変換をしていたのですが、
epwing2tsvが途中で落ちてしまうみたいです。

> C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
> processing file 0x00... done.
> processing file 0x91... done.

ここで、「問題が発生したため、epwing2tsv.exeを終了します。」のダイアログが出ます。
で、上に書いてあったエラーレベル表示をしてみると、

C:\epwing2tsv>echo %errorlevel%
-1073741819

でした。


244:124
08/09/06 02:06:26 HtUug95j
>>243
それでエラーが特定できるか分かりませんが、
とりあえず調べてみます。

たぶん同じようにエラーは出ると思いますが、
少し前に一部修正したものをupしたので一応試してみてください。

245:名無しさん@3周年
08/09/06 02:40:56 vX1uwmCK
>>244
よろしくお願いします。
上に書き込んだ結果は直前にダウンロードした最新版での結果です。


246:124
08/09/06 02:46:09 HtUug95j
>>245
後、<1F41><1F61>の検索キー記述子が、
00のファイルにあることを確認してもらえますか?

247:名無しさん@3周年
08/09/06 03:12:12 vX1uwmCK
>>246
その二つはありました。


248:124
08/09/06 03:39:13 HtUug95j
>>247
原因は大体分かりました。
数日中に直せると思います。

249:名無しさん@3周年
08/09/06 03:43:31 vX1uwmCK
>>248
素早い対応ありがとうございます。
よろしくお願いします。


250:124
08/09/06 13:20:50 HtUug95j
>>249
少しエラー処理を修正してupしました。
これでも変換できるようにはなりませんが、
ダイアログが出て終了ということはないと思います。

これでもう一度、表示内容と、%errorlevel%を教えてください。

251:名無しさん@3周年
08/09/06 13:58:53 vX1uwmCK
>>250
早速の対応ありがとうございました。

以下のようになりました。
C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
processing file 0x00... done.
processing file 0x91... done.
writing to file: output.txt
C:\epwing2tsv>echo %errorlevel%
-1073741819

前回と違うのは、「wrting to file...」の表示がされてから、
エラーダイアログが出たということです。
(前回はwriting to...は表示されませんでした)
よろしくお願いします。


252:124
08/09/06 14:58:26 HtUug95j
>>251
思っていたより厄介で、時間が掛かるかもしれません、、

たぶんwriting to~の前のどこかで、
文字列のオーバーフローでメモリ領域をぐちゃぐちゃにしてるのかもしれません。

コードを整理しながらじっくり見直さないとだめみたいです。
数日中には出来ると思ったのですが無理だと思います。すみません。

253:名無しさん@3周年
08/09/07 22:14:25 PdUh82vj
他の辞書でも似たようなエラーが出ないか確認してみました。

90と91両方出力可能な辞書のダンプファイルを用い、
  00 90で実行すると似たようなエラー
  00 91で実行したら、エラー無く完了

echo %errorlevel%の数値も251と全く同じでした。

>>252
大変そうで申し訳ないです。
よろしくお願いします。


254:名無しさん@3周年
08/09/07 22:43:28 qxTYDd3a
せかして悪いけどwikipedia電子辞書搭載は可能そう?
糞重くてもいいから…

せっかくG10000買う決心付いたのに揺らいだジャマイカ

255:名無しさん@3周年
08/09/07 23:20:34 PdUh82vj
現状のSIIツールの状態では、
wikipediaの変換はエラーになるんじゃないかな。
出来てもまともに機能し無さそう。

自分の場合、Longmanを変換しようとしたら、
例文数10万制限にかかって分割しないと変換できなかった。

半分に分けたらエラーは出ないで変換できたものの、
電子辞書上で検索すると大量の文字化け発生。

さらに検索結果から選択して例文を表示させると、
プログラム実行エラーになって、
そのまま電子辞書自体が落ちたことが何度も。

どうやら<I>タグが大量にあると、
こういうことになってしまうみたい。
エラーが発生したデータでは、10万以上<I></I>が使われていた。
これを削除して変換したら、
文字化けしない正常動作する辞書が出来た。


256:名無しさん@3周年
08/09/07 23:26:43 qxTYDd3a
>>255
トンクス

ついでにもひとつ
・テキストビューワ
・MP3プレイヤー
この二つはソフトなしで、SDにつっこむだけで使えるの?
マカーなのでソフト使えないんだが

257:名無しさん@3周年
08/09/07 23:49:28 PdUh82vj
>>256
自分が持っているのは大学生協モデルのSL900Xですが、
自分の機種では使えています。

テキストビューワは、ファイル名を~.txtにして入れるだけ。
テキスト中の語を検索語にして、
辞書で調べながら読むことが出来ます。

MP3プレーヤーもファイル入れるだけです。
320kまで対応していました。
電子辞書本体をパソコンにつないでも、
SDカードに書き込めないので、他で書き込む必要はありますが。
内蔵メモリーは128Mで、その範囲ならパソコンから直接書き込めます。


258:名無しさん@3周年
08/09/08 04:10:56 oeCOTHZi
SIIの辞書ツール、10M程度のソースの変換に、
200M以上メモリー使ってるんだけど、
wikipediaの様な巨大ソース変換させたらどうなるんだろう・・・


259:124
08/09/08 05:22:49 uNysGGH2
>>253
自分でもエラーが出る辞書探しながらやってみます。

>>254
出来る可能性が数%あります、という程度です。
正直自分でも分かりません。

>>255
変換できても辞書で動かないこともあるんですね…。
usrファイルってどういうフォーマットなんだろう。

>>258
700Mぐらいのファイルで2.5G以上使うみたいです。
使ってるPCが物理メモリ1.2Gなので、スワップしまくりで
3日ほど放置しましたが、変換が終わりませんでした。

260:124
08/09/08 08:27:57 uNysGGH2
今、wikipediaの最初の10万件を変換してみました。
メモリ使用量は約1.3G程度でした。
PenM 1.6GHzのCPU時間で1時間掛かりました。
変換前容量は260M、変換後は95M

このデータは、DDwinの出力を処理してmecabで読みを振った、
前に作ったデータです。そのためリンク情報等は含まれていません。

結論ですが、使い物になりません。
1つの検索に約20秒かかります。

このデータためしに使ってみたい人いますか?
夜なら、wikipediaなのでGFDLにしたがってupできますが。

261:名無しさん@3周年
08/09/08 13:00:30 oeCOTHZi
10M程度のファイルで、エラーも出ないのに、
一晩かかってもSIIツールでの変換が終わらないのがあります
SIIツールは完成度があれですね・・・


262:名無しさん@3周年
08/09/08 16:38:02 TVpyNXxt
SII がんばってくらはい!

263:名無しさん@3周年
08/09/08 23:56:22 oeCOTHZi
共に簡単に変換できる2Mと5Mのファイルを一つにまとめたら、
変換にかなり時間がかかった。
データファイルサイズが7Mなのに、
変換時に960MもRAM使うし・・・

例文検索用辞書を作るだけなら、
細かくファイル分けして、
小さい辞書をたくさん作った方がよさそう。


264:名無しさん@3周年
08/09/09 02:20:36 a1SLp+4C
インデックス作成時に莫大なメモリを使うのは仕方ない面もあると思う。
検索機能が優れているだけに。

推測だけど、

例えば、単純に処理すると、インデックス作成は、
「検索されうる単語の種類」 x 「見出し語の数 (or + 例文の数)」
だけのマトリックスを作ることになる。
つまり、「どういう文字列で検索されたら => どの見出し(or 例文)」っていう対応表。
だから、元の本文ソースよりは遥かに大きなメモリが必要。
あちこちに頻繁に出てくる単語もあるので、ソースを分割しての処理も難しい。

265:名無しさん@3周年
08/09/09 02:22:29 a1SLp+4C
メモリが1GBとか2GBしかないマシンだと、スラッシングが起きてると思う。
メモリの内容をディスク上に退避 & 退避してたデータをメモリに読み込み、
の動作だけでマシンの能力のほとんどを使い切っている状態。
これが始まってしまうと本来の作業はほとんど進まないから、かかる時間は急激に増大する。

元データから、どれくらいのメモリがあればインデックス作成できるかの目安があるといいね。
一概に言えないところではあるだろうし、ソースサイズの2乗で効いてきそうだけど。

(と言って、SIIツールは完成度が高いと言う気はさらさらないですが。)

266:名無しさん@3周年
08/09/09 02:28:33 a1SLp+4C
あと、仮に、上の様な処理をやっているのだとして、
最終的にはインデックスデータをコンパクトな形式に(いわば)圧縮する筈だけど、
その際にも、インデックスに入るデータの全体像が見えてないと「圧縮」というか、
できあがりインデックスを効率良く詰めて作れない、ということもあると思う。

267:名無しさん@3周年
08/09/09 04:20:55 4q5qYDSl
E-DICの例文辞書作成出来ました。
複数辞書ファイルがあっても全て検索してくれるので、
細かくファイルを分けて正解でした。

本体内蔵メモリーよりSDカードに入れたときの方が、
反応が速い気がしたけど気のせい?
検索速度は内蔵辞書よりちょっと遅いかな、といった程度。
十分実用範囲内です。


268:名無しさん@3周年
08/09/09 11:31:32 WJE9rjtp
SIIさん お疲れ様です。
開発頑張ってくらはい。

269:名無しさん@3周年
08/09/10 04:11:22 fLs9Tx13
そういえば、自作辞書が使える辞書にSR-S8100が増えてるね。

それよりはやく、辞書作成するソフトを更新してほしぃ

270:名無しさん@3周年
08/09/10 10:20:30 TdhjWQuu
>>267
おぉ、これを入れれば日本語例文検索ができないという唯一の欠点を
補える。本当はソフトのアップグレードで搭載コンテンツからSIIに
対応してもらうのが一番いいんだけどね…

271:名無しさん@3周年
08/09/10 10:34:05 NyrtNviq
4GBのSDカード使っても、2GBしか認識されないのかな?

272:名無しさん@3周年
08/09/10 14:16:22 z09qCgVD
Cobuild3版のwordbankを変換してみました。

EBDumpの出力は00しか出来ない(90,91が無かった)ので、
epwing2tsvは使えませんでしたが、
Rubyを使ったCobuild→EPWING化ツールの出力結果が、
1行1例文?という非常にシンプルなものだったので、
それを利用したら、簡単に例文辞書化できました。

30万行あったので数万行ずつ小分け。
例文検索も比較的素早くできているようです。

ただしRubyによる変換ツールの出力結果は、
一部おかしい部分もある様子。


273:124
08/09/10 15:36:19 FK1M7aXc
>272
00だけのepwingもあるんですね、
知りませんでした。

274:124
08/09/10 15:45:02 FK1M7aXc
ちょっと考えてたんですが、
weboxとか巡集とかで取り込んだサイトを、
電子辞書でリンクたどりながら見れたら面白そうですよね。
私はしばらく実装してる暇がないのですが。

275:名無しさん@3周年
08/09/11 01:56:59 00Kr+3Mj
00 90 91 txtファイル作成から、コマンドプロンプトで、

processing file 0x00 ... done.
processing file 0x90 ...

と表示され、tmpファイル2つできます。

echo %errorlevel%を入力すると、10 になりました。

原因は、何でしょうか??

276:124
08/09/11 05:11:45 QTgGlywC
>>275
90のファイルは、途中から
C0:あ[2] [1C79:11E][14F88:02]
00:ああ[4] [1D:166][14F88:7B6]
のような書式になってるはずです(80:で始まる行は無視しています)

[2]や[4]の後にタブがあるはずなのですが、ない行があると10を返しているようです。
本来もっとちゃんと処理すべきところですね。
週末あたりに、「メッセージ出してその行を飛ばす」ように書き換えます。

277:名無しさん@3周年
08/09/13 10:06:51 GoMNFI1q
大辞泉か広辞苑かと言うのは悩むね

278:124
08/09/14 14:27:42 B+Q93BcR
>>275
とりあえず更新しました。
エラー出ている行を飛ばしているだけです。
表示された行を探してその周辺で、書式を確認するといいかもしれません。

279:名無しさん@3周年
08/09/14 15:17:04 bNB/x5j8
広辞苑=時代順に意味が載ってる。左翼
大辞林=頻度順に意味が載ってる
大辞泉=カラーで図が多い。大辞林と同じ人が作ってる

程度な印象。あってる?

280:名無しさん@3周年
08/09/14 16:14:02 K7Nw6Qvz
>>278 さっそくの更新ありがとうございました。

無事、output.txt が出来ました。
さっそくoutput txt を クリエーターで .usr ファイルに変換しました。

本体で、そのファイルを検索してみたのですが、検索ができません。
分類別検索でみると、すべて文字化けしているようです。

ともかく、output txt は無事できました。
ありがとうございました。

281:名無しさん@3周年
08/09/14 19:41:26 u1R7hnWR
広辞苑ってそんなにいいか?
特に悪いということはないけど
特に良いとも思わないのだが

282:名無しさん@3周年
08/09/14 19:50:52 CQTA+5tX
まあ、詳しいことは載ってないわ、意味わからない説明だわってのはあるよね。



283:名無しさん@3周年
08/09/15 22:12:07 pWiyS9/t
その三冊の中では個人的には大辞林がだんとつ。ただの字引ではなくて、
百科事典的に作っているから、初めて見る単語(経済用語とか)を引いたとき
とても役に立つ。
広辞苑と大辞泉はあまり比べられない。ただ、改訂直後というのは魅力ではある
こないだ、大辞泉、広辞苑(旧版)搭載機種では意味すら出てこなかった単語が、
大辞林でそこそこ詳しく出てきたのに感動した

284:名無しさん@3周年
08/09/16 13:19:23 1sJ7i3yN
他スレから紹介されてここにきました

初歩的な質問ですが
SR-S9000 SL900Xでは
この電子辞書にさらにコンテンツ加えて
マイ辞書を作れるものでしょうか?
そういうのって出来ますか?
CD-ROMやダウンロードからででも
そういうのできる最適の機種あったら教えていただけませんか?
英語で気に入った英々辞典入れたいんですが
全部気に入った辞書コンテンツ入ってるのってないんですよね
探した限りでは

285:名無しさん@3周年
08/09/16 13:54:06 j8d7b/dY
そういうのはカシオの得意分野なんじゃないの?

286:名無しさん@3周年
08/09/16 16:06:12 KIghNMhp
>>284
まずどの英英を使いたいのか書くべき

287:名無しさん@3周年
08/09/21 23:46:03 PhO4uqdZ
進んでいるようですねー

ソフトウェア開発これからもがんばってくださいー

288:名無しさん@3周年
08/09/22 08:30:51 lnlDvjqB
この機種に日本語キーワード例文検索がないのは残念。
学習者向けには便利な機能なはずだが。
そこで、ユーザー辞書を追加して代わりをしたいんだが、
お勧めの辞書ある?
また、それを英活の訳語検索と一括で検索出来たりする
方法はある?

この機能が購入を踏みとどまってしまう唯一の点。
G10000の後継機では対応してくるかな。
G大、英和大、英活、COBUILD、Wordbankで日本語例文検索できたら
ものすごい。って英英は無理か

289:名無しさん@3周年
08/09/24 05:29:20 SP7VVcF1
社員さんがんばってください

290:名無しさん@3周年
08/09/26 14:09:40 7yddEo/2
うらーーー
ソフトの開発の方はどうですか?

291:名無しさん@3周年
08/09/28 03:19:09 S8TA4D6D
URLリンク(www.alc.co.jp)

前の書き込みでSVLの単語辞書を作った人いたけど、やっぱ手打ちでいかないと
作れないかな?これを単語帳にできるとSL900Xがますます手放せなくなると
思うんだけど。

292:名無しさん@3周年
08/09/28 10:55:14 z+jFpyym
>>291
コピーしてexcelに貼付ければいいんじゃまいか
いや作ったこと無いが

293:名無しさん@3周年
08/09/28 13:44:10 S8TA4D6D
>>292
英単語は簡単に貼り付けられるけど、和訳が問題。
Lingoesで表示された英辞郎の訳をコピペして作ろうかなと思ったんだけど、
膨大な時間がかかりそうだからさぁ。
上級の3000語程度ならなんとか手作業でできなくもないけど。

294:名無しさん@3周年
08/10/01 21:19:46 wT1o4rzM
>>291
学辞郎→PSS変換→エクセル整形で自動です。

SVL入れてからは、
 覚えていない単語のSVLチェック→例文検索→単語帳登録
のコンボをしてます。

メーカーには単語帳の登録制限を無くして欲しい。

295:名無しさん@3周年
08/10/02 02:07:54 eH19xvb5
>>294
学辞郎持ってたんですね。
俺はもうめんどくさいんで、SVLの単語集を買ってきちゃった。
でもSVL単語辞書を作ったら需要ありそうだよね。
人海戦術で作れば作れないこともないでしょ。
このスレにいる人だったら、必要だとしても上級3000語ぐらいで十分だろうし。

296:名無しさん@3周年
08/10/05 11:55:24 CYIP1sg9
epwing2tsvを使わせていただいたのですが、
見出し語に漢字や記号が入ってしまい、無効になってしまう語があるのですが、
どうにか成りませんか?

297:名無しさん@3周年
08/10/05 14:32:22 wjgkJsyk
オリジナル単語集が作れるように
メーカーにはTOEICテストボキャブラリーに採用している
単語集形式の作成ソフトを公開して欲しいなあ。
ドリル作成ソフトを使うと、ジャンプ機能が使えないから。
自分にとって、神機寸前なので。


298:124
08/10/06 04:37:57 DmXkx2tD
>>296
最近ruby勉強しながら、ひらがな変換するスクリプト書いてます。
いつ完成するか分かりませんが…。

299:名無しさん@3周年
08/10/06 13:51:40 K/hQ9Qzy
>>298
早く完成させろや禿げ
あっすいません
お願いします^^

300:名無しさん@3周年
08/10/06 19:36:01 RWiX2gGq
>>298
なんかすごいですね。期待してます。
自分の場合は、平仮名以外を除外するようにしていただければ十分です。


301:124
08/10/07 15:44:53 ctM9Sr9k
想定外に早く出来てしまいました。
rubyだと楽でいいですね。

とりあえずupしました。
rubyとmecabが必要です。

302:名無しさん@3周年
08/10/07 19:38:51 bt+h/dbU
>>301
お疲れ様です。
辞書作成付きの上位機種が出たら使わせて頂こうかと。

303:名無しさん@3周年
08/10/08 09:36:54 7AABJoIs
>>301
なんかすごいですね。
自分もプログラミングできるようになりたいです。

304:名無しさん@3周年
08/10/08 14:34:11 7AABJoIs
>>301
動作確認しました

すごいですね。感謝します。

305:名無しさん@3周年
08/10/13 20:51:01 De83UUnG
siidict.netを少しは書きました^^
変換できた辞書、出来なかった辞書等の情報がありましたら、
書いて下さると助かります

URLリンク(siidict.net)

306:124
08/10/14 10:26:59 k0H9jlky
紹介ありがとうございます。
後で少し、自分でも変換可否の欄追加しますね。

307:名無しさん@3周年
08/10/14 21:59:40 78JFQrHE
この辞書に理化学辞書のコンテンツカードつけるといろいろ制約あるみたいなんですけど
今後この辞書でも制約なく表示できるコンテンツカードが出る予定ってありますか?

308:名無しさん@3周年
08/10/14 23:38:24 sY0/W8UW
>>307
既に出ています。いっこだけ

309:名無しさん@3周年
08/10/15 19:50:27 /WfRKssL
これからの新モデルはユーザ辞書対応機が増えるから
このスレも大ブレイクするとおもおよ

310:名無しさん@3周年
08/10/16 15:01:29 JM5t12CD
SIIって電子辞書のPDFマニュアル公開してたっけ?
ちょっと探したけど見つけられなかった。

311:名無しさん@3周年
08/10/16 21:40:58 vCYvi7A/
>>310
無い。他のメーカーは有るのにねえ。

312:名無しさん@3周年
08/10/17 10:17:55 X9Xa+n4u
>>309
だといいなぁ。


313:名無しさん@3周年
08/10/17 21:53:30 7OcXqqwd
わーい辞書変換できました。
satier'sさん
wikiつくってくれた人ありがとう。wikiのとうりにやりました。
通信用語の基礎知識 (2004 年後期版)
URLリンク(openlab.ring.gr.jp)
変換した元の辞書データ wdic-fpw1.4.zip
一応MeCabも通しました。
SIIのツールで少しエラーがでるものの変換結果は良好と思います。

辞書内参照のリストが一部冗長になるのと
(「ー>ZSK」という同じ参照が複数行リストされる)
発音記号がおかしいのはsjisテキストのためと思います。
UTFで試してみます。
あと、追加辞書の部分で本体のスピードが遅くなりました。


314:名無しさん@3周年
08/10/17 22:01:14 7OcXqqwd
>>313 補足
辞書変換に使ったのは
00.txt
71.txt
91.txt
の3つです。

315:名無しさん@3周年
08/10/18 00:03:34 gM88fYBV
>>313
なかなかいいページがあるね。
ところで「とうり」→「とおり」

316:124
08/10/18 18:05:27 gSbHEPzN
>>313
発音記号がおかしいというのは、<A14A>
のようなものが混じっているということでしょうか?

これはepwing自体文字がJISで記録されていて、
JIS X 0208かJIS X 0201に含まれていない文字は外字として登録していて、
それは単純には対応するunicode文字に変換できないため、
コードのまま出力するようにしています。

正常に表示させるためには、
GAIJIをebdumpでテキスト形式にして、そのファイルを参照しながら、
tsvをエディタなどで一文字ずつ<A...>を対応するunicode文字に
置換し、utf-16で保存すればいいと思います。(すごく大変ですが…。

リストが冗長なのは後で直します。

あと、>>314は、たぶん00, 05, 91の間違いでは?

317:124
08/10/18 21:41:46 gSbHEPzN
参照IDが重複するtsvを直すスクリプトを書きました。
ruby uniqlink.rb < inputtsv.txt > outputtsv.txt
として実行できます。

318:313
08/10/19 10:10:21 FIIRmM2Q
>>316
>>317

素早い対応ありがとうございます。m(_ _)m

発音記号についてはその通りです。丁寧な解説で助かります。
表示がうまくできなくても問題ないのでこのままにします。


ID重複修正もかけてみたらなおっていました。ありがとうございました。

00.txt
71.txt
91.txt
ですが00と91以外はどれが良いかわからなくて適当に71を選びました。
05のほうがベターでしょうか?






319:124
08/10/19 11:01:44 jvsU51eM
71は後方一致INDEXで、自作辞書の機能に後方一致検索はないようなので、
71のファイルは入力してもepwing2tsvでは処理していない=無視しています。

確かその状態では00から見出し語を取っていますが、
05を付加すれば見出し語は05から読むようになります。

結果がまったく同じ場合もありますし、どちらが良いかは辞書によると思います。

320:名無しさん@3周年
08/10/19 11:23:26 7omeq17a
自作辞書ではワイルドカードが使えないってこと?

321:124
08/10/19 12:40:10 RHTmsR0Y
今試してみました。
ワイルドカードは使えます。

「*検索語」で後方一致検索ができるので、
>>319は間違いですね。

「自作辞書に後方一致INDEXのファイルは必要ない」に訂正します。

322:名無しさん@3周年
08/10/19 13:28:40 ZNqTMD/v
検証どうも。
ということはインデックスが無くてもワイルドカード検索は出来るのか。へー

323:名無しさん@3周年
08/10/19 13:30:16 ZNqTMD/v
ってワイルドカードの全てのパターンのインデックスを用意するわけないか…。アホなことを言ってしまった。

324:名無しさん@3周年
08/10/19 19:17:00 bo2NAcgw
wikiの変換に成功した人っていないですよね?

325:名無しさん@3周年
08/10/19 19:34:09 ifJL+ahx
ランダムハウスをepwing→900X用に変換した人います?

epwing化で諦めてる現状だけど、900Xで快適に使えるのならもうちょっと頑張ってみようかな


326:124
08/10/19 20:36:00 RHTmsR0Y
>>324
変換には成功しましたが、
辞書で検索が遅すぎて使えませんでした。

327:124
08/10/19 20:55:20 RHTmsR0Y
>>326はwikipediaの話です。。
wikipediaのことじゃなかったらすみません。

328:名無しさん@3周年
08/10/19 21:08:10 ZNqTMD/v
WikipediaをWikiと略すのは電子辞書を電子と略すようなものだな

329:324
08/10/19 23:46:10 bo2NAcgw
すいませんすいません
wikipediaのことです。
時間がかかりすぎですか・・・
何とか分割とか・・・して実用範囲まで持ってこれないものなんですかねぇ~?
僕はwikipediaをepwingにするところまではやったんですけど、その後が無理で・・・
普通にやったら辞書クリエイターで変換できます?
僕がやると、辞書クリエイターがクラッシュして、何度やってもだめでした。

CPU Core2Duo E6750
メモリ2GB
ってな環境です。

330:124
08/10/20 04:53:47 oZZYQa47
50万件のデータは一気にやるとクラッシュしました。
なので10万件で区切ってやりました。

最初の10万件だけでひとつの検索に約20秒ですから、
もっと分割して、1万件ごととかにするとどうなんでしょう…。
やってみないと分からないですね。

331:名無しさん@3周年
08/10/20 08:03:50 xZDxUpIK
ユーザ辞書作成補助スクリプトを作っています。
例えばテキスト形式で1行に1つの英単語のリストを入力すると
その対訳データをPDICのCSV形式ではき出します。
ベースになる辞書データはGENE95です。
流れはこうです。

0.GENE95をCSV形式で保存
1.単語リストをスクリプトに入力してCSVの対訳データを得る
2.->PDICでPDICテキスト形式に変換
3.->EBSutudioでepwingに変換
4.->epwing2tsvで変換
5->SIIの辞書データに変換

身近な単語リストとしてsvlがありますが、このページを保存したHTMLから
抜き出すモードも作りました。レベル2とレベル12を辞書化してみましたが
よさげです



332:名無しさん@3周年
08/10/20 08:19:06 xZDxUpIK
ところがPDIC自身にそういう機能があるみたいではずしてたみたいです。

333:名無しさん@3周年
08/10/20 08:24:03 xZDxUpIK
>>332
こんなのもあるみたい
apsse/Gapsse
URLリンク(www.forest.impress.co.jp)

334:名無しさん@3周年
08/10/20 08:34:44 xZDxUpIK
>>333

GappsseでSVL取得してみましたが超便利でした。
このツールは使える。


335:124
08/10/20 21:13:45 VSuD4IvO
>>329
朝wikipediaを1万件ごとに変換しようとしたら、最初の1万件でクラッシュして終わりました。
原因は調べてませんが、かなり前に変換したときとは別方法なので、何か書式エラーかと。
時間があるときにまた試してみようかなと思います。

>>331
やったことはないので不確かですが、
PDICテキストからtsvにはepwing介さなくてもたぶん簡単に変換できるのでは?
そのほうが情報のロスが少なくてよさそうな気がします。

336:名無しさん@3周年
08/10/21 08:15:00 VyRG4OtV
PDICからtsvならExcelのマクロでも出来るんちゃう

337:名無しさん@3周年
08/10/22 20:48:33 eHKUzO3b
豚切りで悪いけど、電子辞書にエディタが搭載されるきっかけになってほしい。
キーボードが好みなので、できればSIIで。

URLリンク(www.kingjim.co.jp)



338:名無しさん@3周年
08/10/22 21:17:19 8AJTJwms
>>337
同じこと考えた
合体して欲しい

339:名無しさん@3周年
08/10/22 21:19:06 yyHncwW3
337
>URLリンク(www.kingjim.co.jp)

絶対売れない気がする。


340:名無しさん@3周年
08/10/22 21:34:54 8AJTJwms
山根一眞さんが買う

341:名無しさん@3周年
08/10/22 22:35:21 HL719oW+
ポメラ、ちょっとニッチな感じだしね。
売れるかどうかというとちょっと...。

自作辞書利用可という意欲的なS9000の後継機にこそ、
簡易なものでよいのでエディタを搭載して欲しいよ。


342:名無しさん@3周年
08/10/23 10:51:42 UPnZLHQc
エディタなんていらねぇけど?


343:名無しさん@3周年
08/10/23 20:02:50 0kb/XUYY
大変便利なepwing2tsvスクリプトありがとうございます。
便利に使わせてもらっています。

epwing2tsvはEXEになっていて他のファイルはスクリプトのままなので
当然ですがルビーのインストールが必要です。

他のファイルもEXEにしてもらうとさらに敷居が低くなると思います。
MeCabのインストール先はルビーからレジストリを参照すれば取得できると思います。
EXE化されればこれらのファイルを呼び出す簡単なWindowsのGUIを作ろうと思っています。
(MeCabのフォルダ名をWindows側から渡すようにする形もあります)

いかがでしょうか




344:124
08/10/23 20:42:59 3F8XB8FS
>>343
土日の時間があるときにやります。
今のところスクリプトの引数でmecabのパスを渡そうと思っています。

345:名無しさん@3周年
08/10/25 18:32:30 RmTmLXRY
>>344
ということは、epwing3tsv.exeって
もともとはrubyスクリプトなんでしょうか。
もしそうなら、お暇なときに
MacやLinux環境のためにrubyのソースコードを公開していただければ幸いです。


#rubyは正規表現が使いやすいから便利ですねー

346:名無しさん@3周年
08/10/25 20:02:12 Oe+QBTQk
>>343
URLリンク(siidict.net)
にイメージ画像をアップしました。

347:名無しさん@3周年
08/10/25 22:27:30 +SAvKuZ9
来年大学に入学するので大学生協で購入しようと思ってるのですが
この英語に特化したタイプの辞書って毎年モデルチェンジしてるんですか?

348:名無しさん@3周年
08/10/25 23:23:28 NppTCMuQ
>>346
すごいですね。
これがあると、さらにユーザ辞書利用の敷居が低くなって、
作る人も増えそうですね

349:124
08/10/26 02:02:36 ySxD6agz
>>329
いまさらですが、>>335で1万件の変換でクラッシュしたのは、
単にひらがな化し忘れてただけでした。最初の1万件だけですが変換できました。
残りはまだやってません。

>>345
epwing2tsvはCで書きました。rubyは最近始めたばかりなのです。
ruby便利ですよねー、次修正するときは、rubyで書き直す"かも"です。

>>346
いい感じですねー、
明日?今日中にはexe化します。

350:名無しさん@3周年
08/10/26 10:11:49 3MenByCq
>>349
Cをruby化すると10倍くらい処理時間が落ちる感じです。
Cで1秒未満の処理ならいいですが数十秒だとするとつらいかもです。
実際に作ってみないとわかりませんが

351:124
08/10/26 11:36:21 ySxD6agz
>>350
確かに速度は遅いですよね、
1.91に少し期待です。

今からuniqlink.rbのexe版upします。
hiraka.rbはスクリプト変更しなきゃいけないのでまだです。

352:124
08/10/26 13:34:32 ySxD6agz
すべてexe化完了し、公開しました。

353:名無しさん@3周年
08/10/26 18:54:32 X3tf7N2T
>>349
ありがとうございます。そうでしたか。。
win機も利用しようと思えば利用できるので、そちらで試してみることにします。

354:343
08/10/26 23:17:29 ouWvhg52
>>352
早々の対応ありがとうございます。
Windowsのソフトはインストーラ形式にする予定でスクリプトのEXEファイルも
インストーラに内蔵してしまえばさらに楽にインストール可能になると思いますが
いかがでしょうか。
インストール後にスクリプトのEXEファイルを個別指定できますのでスクリプトの
最新版にあとから指定し直すことも可能です。

テストバージョンは今週末か来月上旬にどこかにアップします。



355:124
08/10/27 21:35:02 G5TFBGVw
>>354
インストーラに内蔵してもらって構いません。
公開が楽しみです。

356:名無しさん@3周年
08/10/27 22:20:55 bQ9eZkad
>>354
個人的なことですが、
インストーラ付パッケージと
zipの2種類用意した方が好きです。

357:343
08/10/27 22:33:37 bY/qHlnZ
>>355
快諾ありがとうございます。
インストーラのサイズは1Mバイトくらいになりそうです。
あと01.txtや91.txtの欄はひとまず4つしか用意していないですが
5つ以上の可能性はあるのでしょうか?


>>356
zipバージョンも用意します

358:343
08/10/27 22:42:15 bY/qHlnZ
>>356
zipバージョンなんですが、現状ではレジストリへの書き込みをする予定でインストーラの場合は
アンイストール時に自動的にレジストリを消去します。

zipの場合アンインストーラがないのでレジストリ消去用のEXEファイルを同梱しますが
実行し忘れればレジストリは残ってしまいます。




359:343
08/10/27 22:45:28 bY/qHlnZ
>>358
レジストリではなくiniファイル方式で考えてみます。

360:124
08/10/28 06:50:34 ehX/x9Wu
>>357
00,04,05,0A,90,91,81で最大7つになります。
…そんなに指定する人がいるかどうか分かりませんが…。

361:名無しさん@3周年
08/10/28 11:53:34 9Q6Gpxto
・SII SR-E6000
・SII SR-S9000
で悩んでいますが中3だとSII SR-E6000が無難ですか?
一応御三家中学なのでそれなりのレベルまでは勉強しているつもりです。
今日学校の帰りに買おうと思っています。

362:名無しさん@3周年
08/10/28 14:58:13 Hl1sSRHf
>>361
中学生なら学生向けモデルの方がいいんじゃないか…。
E6000は英語の類語辞典が無いのが痛い。
S9000は英語を「用意された教材」ではなく
英字新聞やラジオなどの「生の教材」で学習する段階で使うレベルの機種だ。
TOEICで言うと800ぐらい。
別にそのレベルに達する前に買ってもいいけど、多分無駄かな。
価格.comで安い型落ちの学生モデルを買うことをお勧めする。

363:名無しさん@3周年
08/10/28 19:35:06 keZStXXM
>>361
SIIは漢和の検索性は悪いし(部品検索や手書きがない)、
古語辞典がないから国語の学習には向いていない
御三家難とかがどのくらいの中学なのかは知らんが
中学生にSIIの英語モデルは勧めない

もう買ったかもしれないけど
こういうのはネットで買った方が遙かに安いから検索してみれ

364:名無しさん@3周年
08/10/28 19:47:16 bb1FwkxO
>>363
SIIのS9000使ってる。古語に関しては、追加の辞書で投入したから問題なし。
英語に関しては、そこらの辞書より優秀
参考書等は、基本的に本で買うのを勧める。

漢和は、あまり引くことがない(熟語として引けばすぐ出るので)
漢文でも、中高生は大概専用の文法書で問題ないはず。
教科書等に注釈あると思うしね。

S9000のメリットとしては、他人と違った百科事典と、(←一人だけ検索結果が出るなんてことも)
英語の膨大な量(英作で役立つかも。膨大すぎてほとんど生かせないだろう)
って感じかな。PCがそこそこ使えるなら、自作辞書入れてみるのもいいかも

周りと同じのがいいなら、シャープやカシオの方がいいとは思うけど。

365:名無しさん@3周年
08/10/28 19:58:20 keZStXXM
>>364
俺も使ってるんだが、古語のシルカってあったっけ?
どこで売ってるか教えてくれ。不便で困ってる。

366:名無しさん@3周年
08/10/28 20:49:32 YfT7gM1/
>>357
おおお!zip感謝です!

367:名無しさん@3周年
08/10/28 22:28:35 bb1FwkxO
>>365
epwing形式の辞書を買って、変換した。
S9000だったらできる。
詳しくは、URLリンク(siidict.net)

368:343
08/11/06 19:42:15 /mpyqlCF
windowsのソフトを作っている>>343です。

ようやく動作テストができるようになりました。
テスト版公開までもう少しかかる感じです。ダウンロードページは以下になります。
URLリンク(kuma.kanpaku.jp)

satierさん header.datは*.txtのあるフォルダにないとエラーになるみたいですが
可能であればepwing2tsv.exeのあるフォルダから参照するほうがいいのかなと思いました。
機会があればご検討をお願いします。

今回は*.txtフォルダにheader.datがない場合はコピーるすように対応しました。



369:124
08/11/06 21:59:18 pEf4Gbgo
>>368
今週の土日には修正します。
それまでお待ちください。。

370:343
08/11/06 22:17:51 B4AEsC2A
>>369

たびたびすいません。
ありがとうざいます。

371:124
08/11/09 23:09:45 meURis9h
>>370
修正の話ですが、
土日に予定がいろいろ入ってしまいできませんでした。
火曜の夜にできると思います。本当にすみません。。

372:名無しさん@3周年
08/11/10 18:23:43 yozd2n2u
124氏、343氏
ご両人のすばらしい能力とボランティア精神に敬意を表します

373:124
08/11/11 19:29:26 vhC7CYOm
>>370
header.datのパスはargv[0]から取得するように変更しました。
output.txtはこれまで通りカレントディレクトリ(作業フォルダ)に出力します。

374:343
08/11/11 20:38:22 3JdMiKih
>>373
お忙しいところありがとうございました。
順調にいけば今日、明日くらいにアップしたいと思います。


ところでZIP版を希望された方、ZIP版のメリットって何でしたっけ?


375:343
08/11/11 20:45:11 3JdMiKih
>> 374 追記

ZIP版ですが

1、インストーラの実行ファイルそのものをZIPで圧縮したもの。
2.インストーラなしの状態でZIP圧縮したもの。

と2種類あると思いますが

1、でもよいのか2、のほうが良いのでしょうか?



376:名無しさん@3周年
08/11/11 22:04:04 aE/VXDic
ふつーzip版といえばインストーラ無しだね
自動でどこかにファイルを置かれたりするのがいやな感じ

377:343
08/11/11 22:09:55 3JdMiKih
>>376

了解しました。



378:名無しさん@3周年
08/11/12 00:05:16 ZFgv7WPO
>>377
ZIP版をお願いしたものです。
>>376さんの言われている通りです。
余計な手間を取らせてすみません。

379:343
08/11/13 23:44:28 KZP0M8Q3
アップしました。
URLリンク(kuma.kanpaku.jp)

380:名無しさん@3周年
08/11/14 02:47:14 jfsWI3c2
>>379
ご苦労様です~
ZIP版感謝です。
ありがたく使わせていただきます。
これでPC初心者にも自作辞書が普及すればいいですね~

381:名無しさん@3周年
08/11/14 06:03:55 5N/bcdT9
>>379
ほえ~お疲れさんです。使いやすそう。

382:124
08/11/15 19:24:50 1w401K5r
お疲れ様です。
私も後で試してみますね。

383:343
08/11/15 20:06:42 3RB3NN4J
どうもです。
現在微妙に変更中です。
新規フォルダをドロップしたとき自動でファイル名をリストするように変更中です。
Ver.0.8.0の部分をVer.0.7.0にすれば実行ファイルは取得できます・

384:名無しさん@3周年
08/11/17 21:33:00 y04mUfhq
URLリンク(www.besta.com.hk)
欲しいんだが買えるとこ知ってる人おらんと?

385:名無しさん@3周年
08/11/18 20:29:09 8oZtErXR
>>384
ココとか
URLリンク(aycts.cart.fc2.com)


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch