【辞書自作】SR-S9000 SL900X【SII 電子辞書】at DGOODS
【辞書自作】SR-S9000 SL900X【SII 電子辞書】 - 暇つぶし2ch136:名無しさん@3周年
08/08/17 11:56:35 Aoe+qlTI
>> 134
> まあ、でも、とにかく動くものを作っちゃってから、改めて改良すればいいんじゃないでしょうか。
そうですね、そうします…。

>> 135
> メーカーと出版社に通報済。おまえみたいな馬鹿がいるから
EPWINGを使わずに独自フォーマットにする辞書が増え、
使いにくくなる。

うーん、epwingから変換するツールを作るのは問題なんでしょうか…。
結論が出るまで公開控えることにします。期待してくれたかたすみません…。

137:名無しさん@3周年
08/08/17 12:16:55 Aoe+qlTI
↑名前書き忘れました、124です。

138:名無しさん@3周年
08/08/17 14:41:47 aXSCde/Z
>>135
>EPWINGを使わずに独自フォーマットにする辞書が増え、
>使いにくくなる。

その理論だと通報したら余計に増えるんじゃないの(笑)。
頭大丈夫かね。

>>136
変換ツールが法に触れるわけでもないし、気にしなくていいでしょ。
そもそも特定の辞書の話もしていないのにどこの出版社に通報したと言うんだろうね。

139:名無しさん@3周年
08/08/17 15:12:52 K3iBvO+l
JIS X4081規格のデータを処理するツールってことでいいんじゃない?
この人は、SIIの辞書が便利になると困るって人なんじゃないかな。

140:124
08/08/17 16:04:32 Aoe+qlTI
>>138
> 変換ツールが法に触れるわけでもないし、気にしなくていいでしょ。
今日は>>135見てから法律調べてるんですが、難しいですね…。

>>139
> JIS X4081規格のデータを処理するツールってことでいいんじゃない?
もちろん、JIS規格のデータを処理してるだけですが、

ユーザーが、他人に著作権のあるデータを処理したときに、
私的改変となり、その適法性が問題になり、もしこれが違法と判断されれば、
ツール作者が著作権法違反幇助ということですよね。

法律に詳しいわけではないので、
おかしなこと言ってたらどんどん教えてください。

とりあえず完成させないと話にならないので、続きやります。
作る分には問題ないでしょうから。

141:124
08/08/17 16:16:08 Aoe+qlTI
ちなみに個人的には、
実際出来るかどうかは別として、項目数の制限がなさそうなので、
wikipediaをepwing化して電子辞書に入れようと試しています。

数日前にDDwinのエディタ起動で出力されたwikipediaをtsvにして、
SIIのツールで変換しようとしたら、読み込んでも、変換中にツールが落ちたり、
HDD容量は空いているはずなのに、変換しようとした瞬間に、
「HDD空き容量が足りない」と出たり、うまくいきませんでしたが。

「HDD空き容量が足りない」については、
Excelで適当に作った70MBほどのデータでも出たので、
今、SIIに問い合わせ中です。

epwingからの変換ツールを作ろうとしたきっかけは、
DDwinの出力ではリンク情報が取り出せないので、
epwingから直接変換しようと思ったことだったりします。

142:名無しさん@3周年
08/08/17 17:53:18 K3iBvO+l
SIIの「ユーザー辞書の作りかた」のP.19にある「制限事項」に引っかかってるとか?
「本文 最大4,000文字(半角)」は、Wikipediaなんかのテキストを扱おうとすると簡単に超えてしまう。
複数エントリに自分で分けてやらないといけない。
DDWinはそういうことしてくれるのかな。

ちなみに、この4,000文字っての、文字コードを書いてくれないと意味不明。
ソーステキストはShift_JISだったりUTF-16だったりするんだから。
4KBってことだと思うけど、どういう表現の状態で4KBなのかが分からない。

143:名無しさん@3周年
08/08/17 18:02:34 QJxP1sDz
日本語で2000文字か・・・。

144:124
08/08/17 18:27:03 Aoe+qlTI
>>142

> 「本文 最大4,000文字(半角)」は、Wikipediaなんかのテキストを扱おうとすると簡単に超えてしまう。
> 複数エントリに自分で分けてやらないといけない。
wikipedia->tsvの変換の時に分けました。

ちなみに、4000文字超えた場合、tsvからSIIの辞書形式に変換するときにエラーがでて、
そのまま続行すると、辞書の見出し検索に出ないエントリが出来たりするようです。

> 4KBってことだと思うけど、どういう表現の状態で4KBなのかが分からない。
これは私も分かりません。unicodeにするときは調べないとダメですね。

145:名無しさん@3周年
08/08/19 23:43:13 iEz7AlOp
ちゃんとコンテンツを購入した人の利便性があがる環境が整えば、
EPWINGは、また売れるようになるんじゃないかな。
だけど、CCCDと同じ道を歩んじゃったんだね。残念。

146:名無しさん@3周年
08/08/20 11:09:16 +D150fAd
EPWINGを他形式に変換するスクリプトなんて
いろんな人が出してるよ。
>>124も無問題

147:124
08/08/21 15:12:33 rracus5P
もう大部分は出来てるんですが、細かい部分をもう少し直します。
もうしばらく掛かりそうですが、8月中にはどうにかします。

>>146
結局何も問題ないみたいで良かったです。

148:名無しさん@3周年
08/08/21 22:04:57 n0KuhNZR
頑張ってくらはい。 期待しているでごじゃる。

149:名無しさん@3周年
08/08/23 22:49:49 fqyAQtq6
SL900Xが届いたので、ユーザー辞書DUO3.0を作った。
ユーザー辞書からもジャンプできるので、使ってて楽しいね。

150:名無しさん@3周年
08/08/23 22:57:56 VgA3jX/A
>>149
そんなことできるんだ。

151:名無しさん@3周年
08/08/25 10:44:31 BrCkwjI5
テキストと音声が連携する環境が作れるね
スゴイなこれ

152:名無しさん@3周年
08/08/25 23:06:26 V9Q0Z6yM
SVLの12000語単語辞書を半日くらいかけて作ってみた。
見出し語、簡単な訳、それとSVLのレベル程度を自作辞書に入力しとけば
単語の音声や詳細な意味はオリジナル辞書から引っぱれる。
逆に未知の単語からSVLのレベルを検索することも可能。
うまく説明できないけど、この辞書スゴイよ。

153:名無しさん@3周年
08/08/26 00:41:26 hETmnOsj
>>152
ヘーそんなの出来るんだ。欲しくなってきた

154:名無しさん@3周年
08/08/26 01:55:33 ZXhYA0Qz
svlってなに?

155:名無しさん@3周年
08/08/26 07:35:15 YzoAEE/b
>>154
「標準語彙水準12000」(SVL=Standard Vocabulary List)は、過去30年にわたり、多数の学習教材・書籍を通じて、
英語学習者の皆さんをサポートしてきたアルクが、その過程で蓄積してきたさまざまな英文データと、
多数の貴重な選考資料をもとに、日本人の英語学習者にとって有用であると思われる英語語彙1万2000語を選び出し、
それを基礎から上級へと12のレベルに区分した段階別学習語彙リストです。

156:名無しさん@3周年
08/08/26 18:59:59 ZXhYA0Qz
>>152
shareに流してちょー

157:名無しさん@3周年
08/08/26 19:16:53 SAY/dUUB
>>156
流した側が犯罪者になりますが

158:名無しさん@3周年
08/08/30 02:13:43 WyfP8p80
このメーカーは今でも検索機能はナンバーワンですか?
他メーカーもかなり充実してきてるようなのですが

159:名無しさん@3周年
08/08/30 07:56:45 Bqcol4XL
>>158
今ある辞書の中では最高の検索機能ですよ。
操作周りもやはり一番使いやすいです。

160:名無しさん@3周年
08/08/30 10:31:56 Bjy/0gF6
>>158
他メーカーは検索機能に関しては全く進歩してないよ

161:名無しさん@3周年
08/08/31 12:14:37 tFxvsmUn
さっき道歩いてたら>>1がキモい顔して近寄ってきたでまじムッカついてボコボコにしたら
鼻血でて眼鏡とんで前歯折れて「あがああ!まえば!おれた」て叫んでうざかったで
口に牛肉ねじこんだら「んごごごごご」とか呻いてたでオメガ便器に顔突っ込んだら
鼻血まみれで「ばぶう」とか言ってて超絶笑えたでとどめにしねバーカとか罵声あびしたったwwwww
>>1悲惨wwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

162:124
08/08/31 18:26:18 pSCMEZgI
epwing -> tsv変換ツール、
どのくらい需要あるか分かりませんけど、現時点版をとりあえずupしました。
でもまだ中途半端ですね…。
URLリンク(ameblo.jp)

163:名無しさん@3周年
08/08/31 18:28:24 y8UCpWeS
>>162
サンクス
とりあえずテストしてみるわ

164:名無しさん@3周年
08/08/31 18:32:03 y8UCpWeS
>>162
アメブロからの直リンでDLファイル指定するとDL出来ないっぽい

165:124
08/08/31 18:36:32 pSCMEZgI
>>164
すみません、、気づきませんでした。
とりあえず直リンは消しました。

166:名無しさん@3周年
08/08/31 19:17:56 y8UCpWeS
>>162
URLリンク(maximilky.hp.infoseek.co.jp)の人名辞典を変換してみた。
00と90のみを使った場合を作ってみたが、基本的に大丈夫そう。
S9000に入れて使ってみているが問題はなさそう。
なかなか良くできてると思う。感謝

ただ、vistaで使えないようだ。XPではできたけど。

167:124
08/08/31 19:33:21 pSCMEZgI
>>166
報告どうもです。
うまく動いたみたいで良かったです。
時間が空いたらもう少し直してまたupしますね。

vistaは持ってないんですよね、、
とりあえずvistaは動かないって書いときます。

168:名無しさん@3周年
08/08/31 19:56:16 y8UCpWeS
>>167
もしかしたら特定の環境でだけ使えないと言うこともあるかと
うちのvistaで出るエラーは

このアプリケーションのサイド バイ サイド構成が正しくないため、アプリケーションを
開始できませんでした。詳細については、アプリケーションのイベント ログを参照して
ください。

169:名無しさん@3周年
08/08/31 20:06:17 pSCMEZgI
>>168
どうなんでしょう。
サイド バイ サイド構成なんて初めて聞きました。

ちょっと調べてみたんですが????な状態です。
今のところはvistaは動作未確認ですね。

170:名無しさん@3周年
08/08/31 20:10:43 y8UCpWeS
>>169
とりあえずは「vistaは動作未確認」とだけ書いておいて、
使えたかどうかをここやブログに書いて貰えばいいでしょう。

たまたま俺の環境でダメだっただけかもしれませんので。

URLリンク(siidict.net) で紹介してもいいぐらいの出来だと思います。

今からちょっと大きめのファイルにも挑戦してみようかと思ってます。
あとで報告に来ますので

171:124
08/08/31 20:28:42 pSCMEZgI
>>170
vista動作未確認にしておきました。

wikiに書くには、個人的にはもう少しクオリティ上げないといけないなぁと思っています。

今の状態では見出しが重複することがあるので、それを直さないと…。
時間見つけて来週中ぐらいには直しますね。

報告よろしくです。

172:124
08/08/31 20:45:01 pSCMEZgI
>>170
連投すみません。
vista対応かもしれないテスト版をupしました。

よろしければテストしていただけませんか?

173:名無しさん@3周年
08/08/31 20:55:00 y8UCpWeS
>>172
vistaで使えるようになりました!

174:124
08/08/31 21:00:17 pSCMEZgI
>>173
おー良かった良かった。

vistaにランタイムがなかったみたいです。実行ファイルにスタティックリンクしました。
ファイルサイズわずかに増えましたけど今の時代気にならないのでこっちを正式版にしますね。

175:名無しさん@3周年
08/08/31 21:54:15 cjlMaIRe
124を主要EPWING辞書出版社に通報しますた。あんた、もし他社のEPWING辞書をセイコーの辞書形式に
変換する奴が出てきて出版社から訴えられたらたらどうするんだ?
違法コピーする奴だけでなく、違法コピーを助長させるツールを作る奴も
責任問われるのはWINNYの例を見れば分かるだろ? 個人で作って使うだけなら
何も問題ないことでも、公開したらどうなるかってことぐらい分からんか?

176:名無しさん@3周年
08/08/31 21:57:38 y8UCpWeS
>>175
またでた。
それなら長く息の続いてる
URLリンク(maximilky.hp.infoseek.co.jp)のようなフリー素材をepwingにした物や、
URLリンク(www31.ocn.ne.jp)のようなディスク辞書変換スクリプトなんかはどうなるんだろな。

EPWING形式自体を個人で作り上げることが出来る以上、
それを変換するスクリプトも問題はない。

177:名無しさん@3周年
08/08/31 22:03:15 y8UCpWeS
>>175の理論だと、
ビデオエンコーダーや、コピー機なんかも違法なんだがな。
youtubeで落とした動画を変換する・・・とかね。
使用が個人の範囲であれば、変換するツールも問題ない。

違法コピーを助長って、それはP2Pがあっての話。
別に124を使うことによって、他人にコピーが渡ることはない。
もちろん変換したデータをP2Pで流せば流した奴は違法になるが。

しかも、最近はEPWINGじゃない形式で出してたりするところも多いから、
今更EPWINGの対策に本腰入れては取りかからないだろな。

178:名無しさん@3周年
08/08/31 22:14:37 llMgMzUY
というか>>175の論理って結局どういうこと?

EPWING形式だろうがtsv形式だろうが、P2Pで違法に流される危険性は全く変わらない。
というかtsvの方がSIIの電子辞書を持っている人しか使えないんだから、むしろ流れても使われる機会は少ない。

EPWINGの辞書を出している出版社にとっては、SIIの電子辞書で使いたいユーザーによって売上も上がる。


出版社にとっての不利益って皆無だよな?

179:名無しさん@3周年
08/08/31 22:18:23 9e8zjTAc
なんでもかんでも著作権侵害幇助にあたると思ってる人がいるんだね
まぁ、訳分からない通報は笑いものになるだけで、
大した実害は無いかな

180:名無しさん@3周年
08/08/31 22:21:32 y8UCpWeS
>>178
結局SIIが便利になると困る人がいるんでしょう。

変換する奴が出てくる→違法コピー
っていうつながりが分からんのだよね。
違法コピーで流れるとすれば、それは変換した奴がP2Pを使うから。
別に124は関係ない

181:175
08/08/31 22:29:47 cjlMaIRe
出版社はけっこう敏感だよ。某出版社やソフトハウスが自社の辞書の変換ツールを
公開した人に、即刻公開中止を要求したこともあったでしょ。作るのは124の自由。
使うのも124の自己責任。しかしそれを公開する以上、124には責任が生じる。
124はその覚悟を持って公開しているのなら、好きにすればいいんじゃない?

182:名無しさん@3周年
08/08/31 22:39:28 y8UCpWeS
>>181
だ・か・ら
EPWINGは辞書の形式としてはかなりメジャーだし、
ファイルは個人でも作れる。

そりゃね、めちゃめちゃプロテクトのかかったファイルを変換されるとまずいんだろうけど、
一般的に広まってるファイル形式を変換されようが仕方のないこと。

URLリンク(www.sra.co.jp)
はフリーの規格だけど、
これを変換するだけのスクリプトなら何ら問題ないのは分かるはず。

ちなみにEPWINGはJIS規格
EPWINGフォーマットは1996年にJIS X4081「日本語電子出版検索データ構造」というJIS規格に制定され
URLリンク(www.epwing.or.jp)

ただのJIS規格

183:名無しさん@3周年
08/08/31 23:28:37 llMgMzUY
>>175
EPWING→独自形式

独自形式→EPWING
では事情が違うということが理解出来ないようだな。

184:名無しさん@3周年
08/09/01 02:12:32 CL874oEX
現実はP2Pでソフト流れてる企業がメジャーになるんだけどな
casioのカードデータなんて流れはじめたらもうcasioの独占状態だろうな

電子辞書持ってないから形式とかよくわからんけど

185:124
08/09/01 07:26:24 plo6Wr2k
>>175
公開の是非について>>135-146あたりで問題になったときに、
私は法律の専門家ではありませんが、公開しても問題ないと判断した理由は、

1. >>182の言うように、
JIS規格を利用してるだけ。
広く公開されてる規格だし、別にプロテクトは一切掛かっていない。

2. >>177の言うように、
音楽動画の変換ツールが問題ないならepwing2tsvも問題ない。
結局、同じようなことしてるだけ。

と考えたからです。
この程度のツールで違法と判断されるなら、
世の中のツールの大部分は違法になってしまうと思います。
もし本当に違法であるなら、そのうち出版社のほうからコンタクトがあるでしょう。

186:名無しさん@3周年
08/09/01 08:36:26 hdPfRhM3
>>185
ほっておけばいいよ。>>175は個人的に気に入らないだけだろ。

187:名無しさん@3周年
08/09/01 10:24:33 hdPfRhM3
>>166
実行中に落ちてしまいます

C:\epwing2tsv>epwing2tsv 1 2 3 4
processing file 0x00... done.
processing file 0x81... done.
processing file 0x90... done.
processing file 0x91... done.

ちなみに 00 と 90 だけでも無理でした

環境は OS:XP home メモリ:512   CPU:pentium4 古い方
です

EBdump の設定を誤っているのかも知れないので、設定内容を教えてもらえませんか。




188:187
08/09/01 10:33:13 hdPfRhM3
ごめんなさい。>>187です。出来ました。
やはりEBDumpの設定を間違っていました・・

189:名無しさん@3周年
08/09/01 12:20:40 hdPfRhM3
読みに記号や漢字が入るとその行は全部飛ばされちゃう・・
その辺りは本家ソフト側でどうにかして欲しいな


それにしてもすごいソフトですね。
作者様に感謝します

190:名無しさん@3周年
08/09/01 13:25:35 MLRisyeS
やっぱ、ROMってるやつ結構いたんだね。
同じ機種持ち仲間がいて嬉しい。

191:名無しさん@3周年
08/09/01 17:20:55 o+Paly1b
124さん
>>141で問題になっている、空き容量が足りませんの問題ですが、
何かSIIから返信はありましたか?
僕は重めの(100MBちょっと)のやつを変換しようとしたら出ました。
もちろんHDDは十分に空いていたのですが。
10MB程度のファイルなら出ないようでした。

192:124
08/09/01 19:49:16 aY+Py2+Y
>>191
8月20日に現在確認中との連絡を受けました。
今は次の連絡を待っています。

193:名無しさん@3周年
08/09/01 22:55:14 KRBFQLdb
SL900X買ってきた
これで辞書作りに参加できる!


194:名無しさん@3周年
08/09/01 23:34:22 hdPfRhM3
>>193
いいねぇ!

195:名無しさん@3周年
08/09/02 00:50:53 +zlQExtr
やっとwikipediaをepwing化したところまで来た

SL900XのSDカードって、
2Gが上限なんだね
>>192が解決できても、wikipediaはちょっと苦しい?

2GSDカードってもうすぐ市場から消えてしまうような気もするし、
(今日750円で買った)
辞書用にいくつか買い置きしておいた方がいいかなぁ


196:124
08/09/02 02:39:58 8ckPV3+0
>>195
tsv変換すると、1.4Gぐらいで、
SIIのツールで変換するとサイズがさらに小さくなるようなので、
2Gあれば問題ないと考えています。

空き容量不足以外にもまだwikipediaを変換するには問題が…。

・見出し重複→今週中に直します。
・読み変換→すでに不完全ながら実装はしたのですが、
    数字記号などの問題があるのでもう少し時間が掛かりそうです。

空き容量不足エラーについて、
約700Mのデータでエラーが出ないファイルもありました。
(データチェック中に、何も表示されずに落ちた)
単にファイルサイズの問題ではないようです。

197:124
08/09/02 05:18:36 8ckPV3+0
>>196でデータチェック中になにも表示されずに落ちた原因は、
以前DDwinの一行テキストを変換したデータだったので、
" -> ""の変換をしていなかったことでした。(epwing2tsvでは変換しています)

1つの「"」を辞書で表示するには、2つ「"」が必要なようです。

データチェックが終わり、「エラー項目の確認」ダイアログが表示されたので、
未実験ですがこの後の変換もうまくいくと思います。

198:124
08/09/02 15:57:20 Ay1IY5Hb
>>197の続きの変換をやってみたのですが、
何度試しても変換中に落ちてしまいました。

で、ファイルを半分に分けて小さくしてから変換しようとしたら、
また、「HDD空き容量が足りません」、と。

以上報告のみ。

199:名無しさん@3周年
08/09/02 18:33:15 ZowZzHm7
wikiとかバカでっかいもの入れたら検索するときウザくない?

200:名無しさん@3周年
08/09/02 19:09:22 +zlQExtr
epwing→tsvじゃなくても、
html→tsv(EBStudio入力用)やxml(freepwing入力用)→tsvが出来れば、
使える電子辞書増えそうだね

201:124
08/09/02 21:26:49 bh08Ujnk
>>199
遅くなるのは間違いないと思いますが、
実際にどれだけ遅くなるかはまだわかりません。
私は、ウザいと思ったら一時的にカード検索OFFにしようと考えています。

>>200
epwing介さず変換できたら便利ですね。
SIIの新機種にも自作辞書の機能が搭載されているみたいですね。
ユーザー数増えていろんなツールが出てくれればいいんですが…。

202:名無しさん@3周年
08/09/02 21:55:33 w8Qfqcnd
次スレは「SII 自作辞書スレ」だね

203:名無しさん@3周年
08/09/02 21:56:21 In+aBRlB

質問させていただきます。

ebdumpで、epwingのhonmonファイルを開き、出力ファイルは、「メモ帳で開く」チェックをはずすし、
記述子 1 で、デキストダンプをクリックしました。そしたら、「ログを作成しました」と表示されました。

そのあと、どうやれば良いのか、わかりません

ホームページを拝見して行ったのですが、普段、ネットくらいしかしないので、最初の「EBdumpのテキストダンプ(記述子)の出力を、
epwing2tsv.exe out1.txt out2.txt out3.txt ...」で早くも意味がわかりませんでした。




たぶん、コマンドプロンプトから操作すると思うのですが、具体的な手順を教えていただけないんでしょうか。

コマンドプロンプトの操作は、C:\epwing2tsv を入力する場所の指定くらいしかわかりません。


使用環境のpcは、xp メモリ 1 gb 、CPU:pentium4 古い方 です。

204:名無しさん@3周年
08/09/02 21:58:03 +zlQExtr
SIIの辞書作成ツール、
詳しい仕様が分からないから手探りで試してる
唯一の情報のpdfが中途半端に一般向けで、
かえって訳分からなくなってるのが残念

205:名無しさん@3周年
08/09/02 22:38:36 +zlQExtr
>>203
出力の仕方はこんな感じ?
(今日初めて使ったから間違っているかも)
 ①honmonファイルの指定
 ②書籍構成要素で[00]本文[90]前方一致かなINDEX[91]前方一致表記形INDEX等を選択
 ③出力ブロック数の設定
 ④出力ファイル名指定
 ⑤テキストダンプ実行

epwing2tsv.exeの使い方は、
例えば、書籍構成要素00,90,91の出力ファイルを00.txt,90.txt,91.txtとすると、
出力ファイルをepwing2tsv.exeと同じフォルダーに入れ、
コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動し、
 epwing2tsvexe 00.txt 90.txt 91.txt
これでoutput.txtがそのディレクトリーに作られるはず

206:名無しさん@3周年
08/09/02 23:16:42 +zlQExtr
変換ツール制限事項(pdfから)

凡例               .|  1つのユーザー辞書ファイル毎に最大半角4000文字
初期画面           .|  640*289モノクロまたは4ビットbmpグレースケールデータ
マーク             .|  16*48,24*72,32*96,48*144(横*縦)ピクセルのモノクロデータ
メニュー表示位置      .|  最大半角16文字
ID               ...|  数字のみ
見出し語          ......|  最大半角256文字
表示用読み         ...|  最大半角256文字
見出し語検索用読み   .....|  1つの読み毎に最大半角150文字。1つのセル内に最大半角4000文字
キーワード検索用読み  .....|  1つの読み毎に最大半角150文字。1つのセル内に最大半角4000文字
本文               .|  最大半角4000文字
参照ID              |  数字のみ
音声データ         .....|  1つのユーザー辞書ファイル毎に最大4,000,000ファイル
ビットマップ           .|  最大640*1500(横*縦)。1つのユーザー辞書ファイル毎に最大65,000ファイル
大分類、中分類、小分類  |  各分類毎に最大3000見出し語
例文               .|  1つのユーザー辞書ファイル毎に最大100,000

207:名無しさん@3周年
08/09/02 23:32:55 In+aBRlB
>>205

ご回答ありがとうございました。

ebdump の所で、②の説明たすかりました。
「00 本文 」「90 前文一致かなindex」「91 前文一致形index」をの3つの選択できていませんでした。
一つつづ選択して、00 90 91 の3つのtextファイルができました。

③に関しては、出力ブロック数 1 のままで実行しました。
④は、テキストダンプ実行後に、メモ帳が出て「名前をつけて入力」で、それぞれ名前を、00 91 90 としました。

epwing2tsv.exeの使い方で

windows xp (c)の場所で、新規ファイルをつくって、その中にepwing2tsv.exeをそのフォルダーに入れました。
同じように、作成された、それぞれ3つの 00 90 91 textファイルを、そのフォルダに入れました。

コマンドプロンプトで、epwing2tsvのあるディレクトリーに移動の場所を指定すると、epw2tsv sourcefile ・・・ となります。

どうも、ディレクトリへ移動できてないみたいです。場所は、プロパティで確認しているので、間違いないのですが。。。

しかし、もう少しで、できそうです。

本当に、ご回答ありがとうございました。


208:名無しさん@3周年
08/09/03 01:58:41 A/kYdDSe
E-DICを変換しようとすると、
「見出し語検索用読み(かな、アルファベット)」の項目に漢字も入って、
SIIツールでエラー出てしまう・・・

他にも色々エラーの元あって、
辞書毎にかなり個別対応しないといけないみたい

209:名無しさん@3周年
08/09/03 03:01:10 A/kYdDSe
三省堂の模範六法2008を変換しようとしたら、
見出し語検索用の読みがなが一切無く、
当然ほぼ全行エラーでどうにもならない感じ

SIIツールでは、見出し語検索出来ない辞書は作れないのかなぁ
リンクたどってみるだけでも十分使いものになるんだけど

210:名無しさん@3周年
08/09/03 04:02:38 A/kYdDSe
SDカードのファイルは、
本体のファイル管理機能で削除できないんだね
本体メモリー領域のファイルは削除できるけど

テキスト閲覧機能も、拡張子がtxtじゃないと見れないのかな
.htmlファイルはファイル名表示されなかった

211:名無しさん@3周年
08/09/03 04:32:05 A/kYdDSe
デジカメにSDカードロックして入れたら、
書き込み・削除共に出来なかった
ロック解除したらフォーマットもできた

SL900Xにロックして入れたら、
書き込みできた
ロック解除しても、何も変わらなかった

微妙な機能だなぁ・・・

212:124
08/09/03 05:34:43 i85nf+ht
>>207
出力ブロック数は、各項目(00: 本文など)のblksに書いてあるブロック数に合わせてください。
epwing2tsv sourcefile ...は書式を出力したつもりなのですが、分かりにくいですね。
次更新のときに少し変えます。

>>209
tsvで「見出し読み」を空にしておけば見出し検索できないエントリが出来るようです。
同様にキーワード読みを空にしておけばキーワード検索できません。
excelなどで消してみるといいかもしれません。リンク、辞書の「次見出し、前見出し」で飛べます。

213:名無しさん@3周年
08/09/03 21:57:01 RP1qUwkh
ヤクザがエグザイルのマネをしてコンサート?・・・893ILE 誕生日コンサート映像
URLリンク(video.nifty.com)

214:名無しさん@3周年
08/09/04 00:27:03 nImdZRWp
E-DICの例文の一部を変換しました
見出し検索語の漢字部分を削ったらエラー無く成功

215:名無しさん@3周年
08/09/04 00:39:11 BYS1TZT/
Amazon Kindle 的な機能も取り入れちゃえばいいのにね
ブレークするのでは?

216:名無しさん@3周年
08/09/04 01:54:50 nImdZRWp
epwing閲覧機能が付けばブレーク・・・

E-DICは4000字制限にかかる項目がかなりある
例文として分割すればいいかな
「○」が区切りに使えそう

217:名無しさん@3周年
08/09/04 02:15:24 FSgddffa
ebdumpで、00 91 90 のtextファイル出力が完了。
出力ファイルをepwing2tsv.exeと同じ新規フォルダーに入れる。
コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動。

epw2tsv sourcefile ・・・

epwing2tsv.exe 00.txt 90.txt 91.txt を入力

unable to open source file : 00.text と表示されます。

考えられる原因は、何でしょうか? 

os xp で、pentium4 です。

パソコンは、ネットしかしません。epwing2tsv.exe と ebdump と epwing 以外に何か準備する必要あるのでしょうか。 

218:名無しさん@3周年
08/09/04 02:22:10 nImdZRWp
>>217
それだけでいけるはずです
(自分はそれで上手くいってるので)

下の表示(unable to...)はエラー表示のコピペそのままでしょうか
そうだとしたら、拡張子txtをtextに打ち間違えただけかな?
そうじゃないなら、何が原因だろう・・・


219:名無しさん@3周年
08/09/04 05:13:44 nImdZRWp
「本文」欄に入れた英文は、
例文検索でかからないみたい
例文じゃないから当然なのかな?

220:124
08/09/04 05:53:55 pvbjSJ0/
>>216
そういえば4000字制限の分割方法も修正しないといけないですね。
英語単語の途中でも関係なしに切ってしまいます。
例文欄については辞書ごとに違うのでどうするかまだ考えていません。

>>217
>>218さんの言うとおり打ち間違いだと思います。
確認してみてください。

>>219
たぶんそういうことなのでしょう。

221:名無しさん@3周年
08/09/04 16:03:27 hmGuOEDt
ひきつづき 217 です

>>218 220 返事ありがとうございます

unable to open source file : 00.txt と表示されます。text は 掲示板への自分の記入ミスでした。

とりあえず、自分の全工程を記入しますので、何かミスに気がつきましたら、どなたかアドバイスください


ebdumpの内容 

①honmonファイルの指定
②書籍構成要素で[00] [90] [91] を選択
③[00] [90] [91]を選択したときの、blks= aaaa の数値を 出力ブロック数(N)に設定
④出力ファイル名を、00 90 91 に指定
⑤記述子(1)で、テキストダンプ実行

00 90 91 txt ファイルの完成

①~⑤まで以外の、設定が必要でしょうか。もしかしたら、infoblock の数も設定が必要でしょうか。

新規ファイルに、00 90 91 txt と epwing2tsv.exe と headerというやつを入れました。

コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動。

epw2tsv sourcefile ・・・

epwing2tsv.exe 00.txt 90.txt 91.txt を入力

unable to open source file : 00.txt と表示されます。

以上に、なります。よろしく、お願いします。

222:124
08/09/04 20:11:13 uEzbZr/A
>>221
④の出力ファイル指定のところで、拡張子(=.txt)が抜けていると思います。
省略して書いているだけかもしれませんが、それ以外に原因が思い浮かびません。


ちなみに今日は、SIIのツールで大きなファイルが変換できない原因が分かりました。
今からSIIに連絡してきます。

223:名無しさん@3周年
08/09/04 20:20:08 /6MVihz4
>>222
おお!原因分かったんですか!すごいですね。

>>221
ファイル名が誤っているんだと思いますよ。
ウィンドウズの設定で、ファイルの拡張子を表示するように設定して、ファイル名の確認をしてみたらどうでしょう。

224:名無しさん@3周年
08/09/04 20:46:52 hmGuOEDt
>> 222 223 返事ありがとうございます。

ご指摘の拡張子のチェックしました。.txt と表示されました。

とりあえず、パソコンを変えてやってみることにします。

ながながとお付き合いください、ありがとうございました。

225:名無しさん@3周年
08/09/04 21:29:22 hmGuOEDt
224です 

進展ありました。
新規ファイルへの移動が、うまくできていませんでした。

今度は、ファイルへ移動してから、epwing2tsv.exe 00.txt 90.txt 91.txt 入力。

processing file 0x00 ... error. と表示された後、その新規ファイル内に
二つのtit.tmp ファイル body.tmp ファイルが作成されました。

う~ん。。。。なぜだろう。。。。



226:124
08/09/04 22:06:31 uEzbZr/A
>>225
tmpファイル類は、メモリに置かなくても済むように一時的に作成しています。

とりあえず、error表示の後に、
echo %errorlevel%
を実行して表示された番号を教えてください。
プログラムを見直しましたが、2と出ているはずです。

だとすれば、<4RBL>や、<何か>などのような、
半角<>に囲まれた十六進数でない内容がファイルに含まれているのだと思います。

EPWINGでは、本文の内容の半角文字は全角化されて格納されていると思うのですが、
そうでない場合もあるのでしょうか…。それとも文字コードの問題かな…。

たぶんepwing2tsvのバグだと思うので近いうちに直します。


227:名無しさん@3周年
08/09/04 22:16:41 hmGuOEDt
>>> 226

error の後、echo %errorlevel% と入力で、ご指摘のとおり 2 と表示されました。

自分は、パソコンの知識はないので、これ以上はファイルの修正できそうにないです。

それにしても、すばらしいソフトです。

何度もお騒がせいたしました。


228:124
08/09/04 22:44:01 uEzbZr/A
エラーを詳しく表示するようにしてをupしましたので、
時間があるときにでも実行してみてもらえますか?

私は朝早いので今日はもう寝ます。おやすみなさい。

229:名無しさん@3周年
08/09/04 23:10:05 hmGuOEDt
>>228 たびたびのご返事ありがとうございます。

エラーの詳細がでました。

epwing2tsv.exe 00.txt 90.txt 91.txt
row 2706: error converting hex <BL$H>
error.

自分の質問ばかりで、すみません。。。

230:名無しさん@3周年
08/09/05 14:17:27 ARx65l5T
00000321 行目 例文に空白があります。
00000321 行目 本文がありません。
00000358 行目 不正なタグがあります。

みたいなエラーが出るのだけど、
その部分だけ抜き出して変換するとエラーにならない・・・
SII提供ツールに色々問題ありそう


231:名無しさん@3周年
08/09/05 15:40:48 ig0ck/rv
>>230
変換ツールは融通が利かないからなぁ


232:名無しさん@3周年
08/09/05 15:59:43 eYw2RsmO
SIIさん、がんばってくらはいよ~
自作辞書は業界ではタブー的な位置で微妙かもわからないけど、なんか作ってくらはいよ~。


233:名無しさん@3周年
08/09/05 19:40:28 7QtJobt6
>>229
epwingの内容に意味不明なタグ(っぽいもの)が紛れ込んでいるみたいですね。
とりあえず、意味不明なタグは解釈しないでそのまま出力するように明日中には変更します。

234:名無しさん@3周年
08/09/05 23:08:39 ARx65l5T
エラーが出ても辞書作成できたので使ってみたら、
改行やタブがちゃんと認識されていない箇所続出
一部がソースのままデータになっていたりする
SIIはツールのバグ直してくれるのかなぁ


235:名無しさん@3周年
08/09/05 23:17:46 ARx65l5T
ソースに「"」を一つ付けだだけで挙動が劇的に変わった
どうなってるんだか・・・


236:名無しさん@3周年
08/09/05 23:23:50 ARx65l5T
「"」が対になっていないとエラー引き起こす?
全部対にしたらエラー消えた


237:名無しさん@3周年
08/09/05 23:28:10 ARx65l5T
「"」で消えたのは、
  00000028 行目 各項目は最大4,000文字です。
というタイプのエラーのみ


238:124
08/09/05 23:59:30 7QtJobt6
>>237
epwing2tsvで変換して、
その後エディタで、「"」 -> 「""」
と変換したということですか?

もしそうなら、epwing2tsvのバグでもあります。
””変換は実装したはずですから。

239:名無しさん@3周年
08/09/06 00:34:55 vX1uwmCK
>>238
epwing2tsvは正常に動作しています。

その後、txtファイルをexcelで読み込んで書き出して・・・とやっている間に、
"が""""""みたいになっていき、
その部分を手動集成している内に"がエラー状態になっていました。

excelは他にも色々問題ありますね・・・
txt読み込み時に;を区切りにしても、
たまに区切ってくれなかったりとか

240:名無しさん@3周年
08/09/06 00:52:22 vX1uwmCK
やっと、E-DICの例文を変換できた!


241:名無しさん@3周年
08/09/06 00:57:04 gTwDy34l
>>232
> SIIさん、がんばってくらはいよ~
SIIさん、Macもよろしくおねがいします!
入力ファイルがXMLもありだったりするとさらに嬉しいです。

242:124
08/09/06 01:18:02 HtUug95j
>>239>>240
バグではなかったようで安心しました。
うまく出来たようでよかったですね。

243:名無しさん@3周年
08/09/06 01:40:13 vX1uwmCK
別の辞書の変換をしていたのですが、
epwing2tsvが途中で落ちてしまうみたいです。

> C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
> processing file 0x00... done.
> processing file 0x91... done.

ここで、「問題が発生したため、epwing2tsv.exeを終了します。」のダイアログが出ます。
で、上に書いてあったエラーレベル表示をしてみると、

C:\epwing2tsv>echo %errorlevel%
-1073741819

でした。


244:124
08/09/06 02:06:26 HtUug95j
>>243
それでエラーが特定できるか分かりませんが、
とりあえず調べてみます。

たぶん同じようにエラーは出ると思いますが、
少し前に一部修正したものをupしたので一応試してみてください。

245:名無しさん@3周年
08/09/06 02:40:56 vX1uwmCK
>>244
よろしくお願いします。
上に書き込んだ結果は直前にダウンロードした最新版での結果です。


246:124
08/09/06 02:46:09 HtUug95j
>>245
後、<1F41><1F61>の検索キー記述子が、
00のファイルにあることを確認してもらえますか?

247:名無しさん@3周年
08/09/06 03:12:12 vX1uwmCK
>>246
その二つはありました。


248:124
08/09/06 03:39:13 HtUug95j
>>247
原因は大体分かりました。
数日中に直せると思います。

249:名無しさん@3周年
08/09/06 03:43:31 vX1uwmCK
>>248
素早い対応ありがとうございます。
よろしくお願いします。


250:124
08/09/06 13:20:50 HtUug95j
>>249
少しエラー処理を修正してupしました。
これでも変換できるようにはなりませんが、
ダイアログが出て終了ということはないと思います。

これでもう一度、表示内容と、%errorlevel%を教えてください。

251:名無しさん@3周年
08/09/06 13:58:53 vX1uwmCK
>>250
早速の対応ありがとうございました。

以下のようになりました。
C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
processing file 0x00... done.
processing file 0x91... done.
writing to file: output.txt
C:\epwing2tsv>echo %errorlevel%
-1073741819

前回と違うのは、「wrting to file...」の表示がされてから、
エラーダイアログが出たということです。
(前回はwriting to...は表示されませんでした)
よろしくお願いします。


252:124
08/09/06 14:58:26 HtUug95j
>>251
思っていたより厄介で、時間が掛かるかもしれません、、

たぶんwriting to~の前のどこかで、
文字列のオーバーフローでメモリ領域をぐちゃぐちゃにしてるのかもしれません。

コードを整理しながらじっくり見直さないとだめみたいです。
数日中には出来ると思ったのですが無理だと思います。すみません。

253:名無しさん@3周年
08/09/07 22:14:25 PdUh82vj
他の辞書でも似たようなエラーが出ないか確認してみました。

90と91両方出力可能な辞書のダンプファイルを用い、
  00 90で実行すると似たようなエラー
  00 91で実行したら、エラー無く完了

echo %errorlevel%の数値も251と全く同じでした。

>>252
大変そうで申し訳ないです。
よろしくお願いします。


254:名無しさん@3周年
08/09/07 22:43:28 qxTYDd3a
せかして悪いけどwikipedia電子辞書搭載は可能そう?
糞重くてもいいから…

せっかくG10000買う決心付いたのに揺らいだジャマイカ

255:名無しさん@3周年
08/09/07 23:20:34 PdUh82vj
現状のSIIツールの状態では、
wikipediaの変換はエラーになるんじゃないかな。
出来てもまともに機能し無さそう。

自分の場合、Longmanを変換しようとしたら、
例文数10万制限にかかって分割しないと変換できなかった。

半分に分けたらエラーは出ないで変換できたものの、
電子辞書上で検索すると大量の文字化け発生。

さらに検索結果から選択して例文を表示させると、
プログラム実行エラーになって、
そのまま電子辞書自体が落ちたことが何度も。

どうやら<I>タグが大量にあると、
こういうことになってしまうみたい。
エラーが発生したデータでは、10万以上<I></I>が使われていた。
これを削除して変換したら、
文字化けしない正常動作する辞書が出来た。


256:名無しさん@3周年
08/09/07 23:26:43 qxTYDd3a
>>255
トンクス

ついでにもひとつ
・テキストビューワ
・MP3プレイヤー
この二つはソフトなしで、SDにつっこむだけで使えるの?
マカーなのでソフト使えないんだが

257:名無しさん@3周年
08/09/07 23:49:28 PdUh82vj
>>256
自分が持っているのは大学生協モデルのSL900Xですが、
自分の機種では使えています。

テキストビューワは、ファイル名を~.txtにして入れるだけ。
テキスト中の語を検索語にして、
辞書で調べながら読むことが出来ます。

MP3プレーヤーもファイル入れるだけです。
320kまで対応していました。
電子辞書本体をパソコンにつないでも、
SDカードに書き込めないので、他で書き込む必要はありますが。
内蔵メモリーは128Mで、その範囲ならパソコンから直接書き込めます。


258:名無しさん@3周年
08/09/08 04:10:56 oeCOTHZi
SIIの辞書ツール、10M程度のソースの変換に、
200M以上メモリー使ってるんだけど、
wikipediaの様な巨大ソース変換させたらどうなるんだろう・・・


259:124
08/09/08 05:22:49 uNysGGH2
>>253
自分でもエラーが出る辞書探しながらやってみます。

>>254
出来る可能性が数%あります、という程度です。
正直自分でも分かりません。

>>255
変換できても辞書で動かないこともあるんですね…。
usrファイルってどういうフォーマットなんだろう。

>>258
700Mぐらいのファイルで2.5G以上使うみたいです。
使ってるPCが物理メモリ1.2Gなので、スワップしまくりで
3日ほど放置しましたが、変換が終わりませんでした。

260:124
08/09/08 08:27:57 uNysGGH2
今、wikipediaの最初の10万件を変換してみました。
メモリ使用量は約1.3G程度でした。
PenM 1.6GHzのCPU時間で1時間掛かりました。
変換前容量は260M、変換後は95M

このデータは、DDwinの出力を処理してmecabで読みを振った、
前に作ったデータです。そのためリンク情報等は含まれていません。

結論ですが、使い物になりません。
1つの検索に約20秒かかります。

このデータためしに使ってみたい人いますか?
夜なら、wikipediaなのでGFDLにしたがってupできますが。

261:名無しさん@3周年
08/09/08 13:00:30 oeCOTHZi
10M程度のファイルで、エラーも出ないのに、
一晩かかってもSIIツールでの変換が終わらないのがあります
SIIツールは完成度があれですね・・・


262:名無しさん@3周年
08/09/08 16:38:02 TVpyNXxt
SII がんばってくらはい!

263:名無しさん@3周年
08/09/08 23:56:22 oeCOTHZi
共に簡単に変換できる2Mと5Mのファイルを一つにまとめたら、
変換にかなり時間がかかった。
データファイルサイズが7Mなのに、
変換時に960MもRAM使うし・・・

例文検索用辞書を作るだけなら、
細かくファイル分けして、
小さい辞書をたくさん作った方がよさそう。


264:名無しさん@3周年
08/09/09 02:20:36 a1SLp+4C
インデックス作成時に莫大なメモリを使うのは仕方ない面もあると思う。
検索機能が優れているだけに。

推測だけど、

例えば、単純に処理すると、インデックス作成は、
「検索されうる単語の種類」 x 「見出し語の数 (or + 例文の数)」
だけのマトリックスを作ることになる。
つまり、「どういう文字列で検索されたら => どの見出し(or 例文)」っていう対応表。
だから、元の本文ソースよりは遥かに大きなメモリが必要。
あちこちに頻繁に出てくる単語もあるので、ソースを分割しての処理も難しい。

265:名無しさん@3周年
08/09/09 02:22:29 a1SLp+4C
メモリが1GBとか2GBしかないマシンだと、スラッシングが起きてると思う。
メモリの内容をディスク上に退避 & 退避してたデータをメモリに読み込み、
の動作だけでマシンの能力のほとんどを使い切っている状態。
これが始まってしまうと本来の作業はほとんど進まないから、かかる時間は急激に増大する。

元データから、どれくらいのメモリがあればインデックス作成できるかの目安があるといいね。
一概に言えないところではあるだろうし、ソースサイズの2乗で効いてきそうだけど。

(と言って、SIIツールは完成度が高いと言う気はさらさらないですが。)

266:名無しさん@3周年
08/09/09 02:28:33 a1SLp+4C
あと、仮に、上の様な処理をやっているのだとして、
最終的にはインデックスデータをコンパクトな形式に(いわば)圧縮する筈だけど、
その際にも、インデックスに入るデータの全体像が見えてないと「圧縮」というか、
できあがりインデックスを効率良く詰めて作れない、ということもあると思う。

267:名無しさん@3周年
08/09/09 04:20:55 4q5qYDSl
E-DICの例文辞書作成出来ました。
複数辞書ファイルがあっても全て検索してくれるので、
細かくファイルを分けて正解でした。

本体内蔵メモリーよりSDカードに入れたときの方が、
反応が速い気がしたけど気のせい?
検索速度は内蔵辞書よりちょっと遅いかな、といった程度。
十分実用範囲内です。


268:名無しさん@3周年
08/09/09 11:31:32 WJE9rjtp
SIIさん お疲れ様です。
開発頑張ってくらはい。

269:名無しさん@3周年
08/09/10 04:11:22 fLs9Tx13
そういえば、自作辞書が使える辞書にSR-S8100が増えてるね。

それよりはやく、辞書作成するソフトを更新してほしぃ

270:名無しさん@3周年
08/09/10 10:20:30 TdhjWQuu
>>267
おぉ、これを入れれば日本語例文検索ができないという唯一の欠点を
補える。本当はソフトのアップグレードで搭載コンテンツからSIIに
対応してもらうのが一番いいんだけどね…

271:名無しさん@3周年
08/09/10 10:34:05 NyrtNviq
4GBのSDカード使っても、2GBしか認識されないのかな?

272:名無しさん@3周年
08/09/10 14:16:22 z09qCgVD
Cobuild3版のwordbankを変換してみました。

EBDumpの出力は00しか出来ない(90,91が無かった)ので、
epwing2tsvは使えませんでしたが、
Rubyを使ったCobuild→EPWING化ツールの出力結果が、
1行1例文?という非常にシンプルなものだったので、
それを利用したら、簡単に例文辞書化できました。

30万行あったので数万行ずつ小分け。
例文検索も比較的素早くできているようです。

ただしRubyによる変換ツールの出力結果は、
一部おかしい部分もある様子。


273:124
08/09/10 15:36:19 FK1M7aXc
>272
00だけのepwingもあるんですね、
知りませんでした。

274:124
08/09/10 15:45:02 FK1M7aXc
ちょっと考えてたんですが、
weboxとか巡集とかで取り込んだサイトを、
電子辞書でリンクたどりながら見れたら面白そうですよね。
私はしばらく実装してる暇がないのですが。

275:名無しさん@3周年
08/09/11 01:56:59 00Kr+3Mj
00 90 91 txtファイル作成から、コマンドプロンプトで、

processing file 0x00 ... done.
processing file 0x90 ...

と表示され、tmpファイル2つできます。

echo %errorlevel%を入力すると、10 になりました。

原因は、何でしょうか??

276:124
08/09/11 05:11:45 QTgGlywC
>>275
90のファイルは、途中から
C0:あ[2] [1C79:11E][14F88:02]
00:ああ[4] [1D:166][14F88:7B6]
のような書式になってるはずです(80:で始まる行は無視しています)

[2]や[4]の後にタブがあるはずなのですが、ない行があると10を返しているようです。
本来もっとちゃんと処理すべきところですね。
週末あたりに、「メッセージ出してその行を飛ばす」ように書き換えます。

277:名無しさん@3周年
08/09/13 10:06:51 GoMNFI1q
大辞泉か広辞苑かと言うのは悩むね

278:124
08/09/14 14:27:42 B+Q93BcR
>>275
とりあえず更新しました。
エラー出ている行を飛ばしているだけです。
表示された行を探してその周辺で、書式を確認するといいかもしれません。

279:名無しさん@3周年
08/09/14 15:17:04 bNB/x5j8
広辞苑=時代順に意味が載ってる。左翼
大辞林=頻度順に意味が載ってる
大辞泉=カラーで図が多い。大辞林と同じ人が作ってる

程度な印象。あってる?

280:名無しさん@3周年
08/09/14 16:14:02 K7Nw6Qvz
>>278 さっそくの更新ありがとうございました。

無事、output.txt が出来ました。
さっそくoutput txt を クリエーターで .usr ファイルに変換しました。

本体で、そのファイルを検索してみたのですが、検索ができません。
分類別検索でみると、すべて文字化けしているようです。

ともかく、output txt は無事できました。
ありがとうございました。

281:名無しさん@3周年
08/09/14 19:41:26 u1R7hnWR
広辞苑ってそんなにいいか?
特に悪いということはないけど
特に良いとも思わないのだが

282:名無しさん@3周年
08/09/14 19:50:52 CQTA+5tX
まあ、詳しいことは載ってないわ、意味わからない説明だわってのはあるよね。



283:名無しさん@3周年
08/09/15 22:12:07 pWiyS9/t
その三冊の中では個人的には大辞林がだんとつ。ただの字引ではなくて、
百科事典的に作っているから、初めて見る単語(経済用語とか)を引いたとき
とても役に立つ。
広辞苑と大辞泉はあまり比べられない。ただ、改訂直後というのは魅力ではある
こないだ、大辞泉、広辞苑(旧版)搭載機種では意味すら出てこなかった単語が、
大辞林でそこそこ詳しく出てきたのに感動した

284:名無しさん@3周年
08/09/16 13:19:23 1sJ7i3yN
他スレから紹介されてここにきました

初歩的な質問ですが
SR-S9000 SL900Xでは
この電子辞書にさらにコンテンツ加えて
マイ辞書を作れるものでしょうか?
そういうのって出来ますか?
CD-ROMやダウンロードからででも
そういうのできる最適の機種あったら教えていただけませんか?
英語で気に入った英々辞典入れたいんですが
全部気に入った辞書コンテンツ入ってるのってないんですよね
探した限りでは

285:名無しさん@3周年
08/09/16 13:54:06 j8d7b/dY
そういうのはカシオの得意分野なんじゃないの?

286:名無しさん@3周年
08/09/16 16:06:12 KIghNMhp
>>284
まずどの英英を使いたいのか書くべき

287:名無しさん@3周年
08/09/21 23:46:03 PhO4uqdZ
進んでいるようですねー

ソフトウェア開発これからもがんばってくださいー

288:名無しさん@3周年
08/09/22 08:30:51 lnlDvjqB
この機種に日本語キーワード例文検索がないのは残念。
学習者向けには便利な機能なはずだが。
そこで、ユーザー辞書を追加して代わりをしたいんだが、
お勧めの辞書ある?
また、それを英活の訳語検索と一括で検索出来たりする
方法はある?

この機能が購入を踏みとどまってしまう唯一の点。
G10000の後継機では対応してくるかな。
G大、英和大、英活、COBUILD、Wordbankで日本語例文検索できたら
ものすごい。って英英は無理か

289:名無しさん@3周年
08/09/24 05:29:20 SP7VVcF1
社員さんがんばってください

290:名無しさん@3周年
08/09/26 14:09:40 7yddEo/2
うらーーー
ソフトの開発の方はどうですか?

291:名無しさん@3周年
08/09/28 03:19:09 S8TA4D6D
URLリンク(www.alc.co.jp)

前の書き込みでSVLの単語辞書を作った人いたけど、やっぱ手打ちでいかないと
作れないかな?これを単語帳にできるとSL900Xがますます手放せなくなると
思うんだけど。

292:名無しさん@3周年
08/09/28 10:55:14 z+jFpyym
>>291
コピーしてexcelに貼付ければいいんじゃまいか
いや作ったこと無いが

293:名無しさん@3周年
08/09/28 13:44:10 S8TA4D6D
>>292
英単語は簡単に貼り付けられるけど、和訳が問題。
Lingoesで表示された英辞郎の訳をコピペして作ろうかなと思ったんだけど、
膨大な時間がかかりそうだからさぁ。
上級の3000語程度ならなんとか手作業でできなくもないけど。

294:名無しさん@3周年
08/10/01 21:19:46 wT1o4rzM
>>291
学辞郎→PSS変換→エクセル整形で自動です。

SVL入れてからは、
 覚えていない単語のSVLチェック→例文検索→単語帳登録
のコンボをしてます。

メーカーには単語帳の登録制限を無くして欲しい。

295:名無しさん@3周年
08/10/02 02:07:54 eH19xvb5
>>294
学辞郎持ってたんですね。
俺はもうめんどくさいんで、SVLの単語集を買ってきちゃった。
でもSVL単語辞書を作ったら需要ありそうだよね。
人海戦術で作れば作れないこともないでしょ。
このスレにいる人だったら、必要だとしても上級3000語ぐらいで十分だろうし。

296:名無しさん@3周年
08/10/05 11:55:24 CYIP1sg9
epwing2tsvを使わせていただいたのですが、
見出し語に漢字や記号が入ってしまい、無効になってしまう語があるのですが、
どうにか成りませんか?

297:名無しさん@3周年
08/10/05 14:32:22 wjgkJsyk
オリジナル単語集が作れるように
メーカーにはTOEICテストボキャブラリーに採用している
単語集形式の作成ソフトを公開して欲しいなあ。
ドリル作成ソフトを使うと、ジャンプ機能が使えないから。
自分にとって、神機寸前なので。


298:124
08/10/06 04:37:57 DmXkx2tD
>>296
最近ruby勉強しながら、ひらがな変換するスクリプト書いてます。
いつ完成するか分かりませんが…。

299:名無しさん@3周年
08/10/06 13:51:40 K/hQ9Qzy
>>298
早く完成させろや禿げ
あっすいません
お願いします^^

300:名無しさん@3周年
08/10/06 19:36:01 RWiX2gGq
>>298
なんかすごいですね。期待してます。
自分の場合は、平仮名以外を除外するようにしていただければ十分です。


301:124
08/10/07 15:44:53 ctM9Sr9k
想定外に早く出来てしまいました。
rubyだと楽でいいですね。

とりあえずupしました。
rubyとmecabが必要です。

302:名無しさん@3周年
08/10/07 19:38:51 bt+h/dbU
>>301
お疲れ様です。
辞書作成付きの上位機種が出たら使わせて頂こうかと。

303:名無しさん@3周年
08/10/08 09:36:54 7AABJoIs
>>301
なんかすごいですね。
自分もプログラミングできるようになりたいです。

304:名無しさん@3周年
08/10/08 14:34:11 7AABJoIs
>>301
動作確認しました

すごいですね。感謝します。

305:名無しさん@3周年
08/10/13 20:51:01 De83UUnG
siidict.netを少しは書きました^^
変換できた辞書、出来なかった辞書等の情報がありましたら、
書いて下さると助かります

URLリンク(siidict.net)

306:124
08/10/14 10:26:59 k0H9jlky
紹介ありがとうございます。
後で少し、自分でも変換可否の欄追加しますね。

307:名無しさん@3周年
08/10/14 21:59:40 78JFQrHE
この辞書に理化学辞書のコンテンツカードつけるといろいろ制約あるみたいなんですけど
今後この辞書でも制約なく表示できるコンテンツカードが出る予定ってありますか?

308:名無しさん@3周年
08/10/14 23:38:24 sY0/W8UW
>>307
既に出ています。いっこだけ

309:名無しさん@3周年
08/10/15 19:50:27 /WfRKssL
これからの新モデルはユーザ辞書対応機が増えるから
このスレも大ブレイクするとおもおよ

310:名無しさん@3周年
08/10/16 15:01:29 JM5t12CD
SIIって電子辞書のPDFマニュアル公開してたっけ?
ちょっと探したけど見つけられなかった。

311:名無しさん@3周年
08/10/16 21:40:58 vCYvi7A/
>>310
無い。他のメーカーは有るのにねえ。

312:名無しさん@3周年
08/10/17 10:17:55 X9Xa+n4u
>>309
だといいなぁ。


313:名無しさん@3周年
08/10/17 21:53:30 7OcXqqwd
わーい辞書変換できました。
satier'sさん
wikiつくってくれた人ありがとう。wikiのとうりにやりました。
通信用語の基礎知識 (2004 年後期版)
URLリンク(openlab.ring.gr.jp)
変換した元の辞書データ wdic-fpw1.4.zip
一応MeCabも通しました。
SIIのツールで少しエラーがでるものの変換結果は良好と思います。

辞書内参照のリストが一部冗長になるのと
(「ー>ZSK」という同じ参照が複数行リストされる)
発音記号がおかしいのはsjisテキストのためと思います。
UTFで試してみます。
あと、追加辞書の部分で本体のスピードが遅くなりました。


314:名無しさん@3周年
08/10/17 22:01:14 7OcXqqwd
>>313 補足
辞書変換に使ったのは
00.txt
71.txt
91.txt
の3つです。

315:名無しさん@3周年
08/10/18 00:03:34 gM88fYBV
>>313
なかなかいいページがあるね。
ところで「とうり」→「とおり」

316:124
08/10/18 18:05:27 gSbHEPzN
>>313
発音記号がおかしいというのは、<A14A>
のようなものが混じっているということでしょうか?

これはepwing自体文字がJISで記録されていて、
JIS X 0208かJIS X 0201に含まれていない文字は外字として登録していて、
それは単純には対応するunicode文字に変換できないため、
コードのまま出力するようにしています。

正常に表示させるためには、
GAIJIをebdumpでテキスト形式にして、そのファイルを参照しながら、
tsvをエディタなどで一文字ずつ<A...>を対応するunicode文字に
置換し、utf-16で保存すればいいと思います。(すごく大変ですが…。

リストが冗長なのは後で直します。

あと、>>314は、たぶん00, 05, 91の間違いでは?

317:124
08/10/18 21:41:46 gSbHEPzN
参照IDが重複するtsvを直すスクリプトを書きました。
ruby uniqlink.rb < inputtsv.txt > outputtsv.txt
として実行できます。

318:313
08/10/19 10:10:21 FIIRmM2Q
>>316
>>317

素早い対応ありがとうございます。m(_ _)m

発音記号についてはその通りです。丁寧な解説で助かります。
表示がうまくできなくても問題ないのでこのままにします。


ID重複修正もかけてみたらなおっていました。ありがとうございました。

00.txt
71.txt
91.txt
ですが00と91以外はどれが良いかわからなくて適当に71を選びました。
05のほうがベターでしょうか?






319:124
08/10/19 11:01:44 jvsU51eM
71は後方一致INDEXで、自作辞書の機能に後方一致検索はないようなので、
71のファイルは入力してもepwing2tsvでは処理していない=無視しています。

確かその状態では00から見出し語を取っていますが、
05を付加すれば見出し語は05から読むようになります。

結果がまったく同じ場合もありますし、どちらが良いかは辞書によると思います。

320:名無しさん@3周年
08/10/19 11:23:26 7omeq17a
自作辞書ではワイルドカードが使えないってこと?

321:124
08/10/19 12:40:10 RHTmsR0Y
今試してみました。
ワイルドカードは使えます。

「*検索語」で後方一致検索ができるので、
>>319は間違いですね。

「自作辞書に後方一致INDEXのファイルは必要ない」に訂正します。

322:名無しさん@3周年
08/10/19 13:28:40 ZNqTMD/v
検証どうも。
ということはインデックスが無くてもワイルドカード検索は出来るのか。へー

323:名無しさん@3周年
08/10/19 13:30:16 ZNqTMD/v
ってワイルドカードの全てのパターンのインデックスを用意するわけないか…。アホなことを言ってしまった。

324:名無しさん@3周年
08/10/19 19:17:00 bo2NAcgw
wikiの変換に成功した人っていないですよね?

325:名無しさん@3周年
08/10/19 19:34:09 ifJL+ahx
ランダムハウスをepwing→900X用に変換した人います?

epwing化で諦めてる現状だけど、900Xで快適に使えるのならもうちょっと頑張ってみようかな


326:124
08/10/19 20:36:00 RHTmsR0Y
>>324
変換には成功しましたが、
辞書で検索が遅すぎて使えませんでした。

327:124
08/10/19 20:55:20 RHTmsR0Y
>>326はwikipediaの話です。。
wikipediaのことじゃなかったらすみません。

328:名無しさん@3周年
08/10/19 21:08:10 ZNqTMD/v
WikipediaをWikiと略すのは電子辞書を電子と略すようなものだな

329:324
08/10/19 23:46:10 bo2NAcgw
すいませんすいません
wikipediaのことです。
時間がかかりすぎですか・・・
何とか分割とか・・・して実用範囲まで持ってこれないものなんですかねぇ~?
僕はwikipediaをepwingにするところまではやったんですけど、その後が無理で・・・
普通にやったら辞書クリエイターで変換できます?
僕がやると、辞書クリエイターがクラッシュして、何度やってもだめでした。

CPU Core2Duo E6750
メモリ2GB
ってな環境です。

330:124
08/10/20 04:53:47 oZZYQa47
50万件のデータは一気にやるとクラッシュしました。
なので10万件で区切ってやりました。

最初の10万件だけでひとつの検索に約20秒ですから、
もっと分割して、1万件ごととかにするとどうなんでしょう…。
やってみないと分からないですね。

331:名無しさん@3周年
08/10/20 08:03:50 xZDxUpIK
ユーザ辞書作成補助スクリプトを作っています。
例えばテキスト形式で1行に1つの英単語のリストを入力すると
その対訳データをPDICのCSV形式ではき出します。
ベースになる辞書データはGENE95です。
流れはこうです。

0.GENE95をCSV形式で保存
1.単語リストをスクリプトに入力してCSVの対訳データを得る
2.->PDICでPDICテキスト形式に変換
3.->EBSutudioでepwingに変換
4.->epwing2tsvで変換
5->SIIの辞書データに変換

身近な単語リストとしてsvlがありますが、このページを保存したHTMLから
抜き出すモードも作りました。レベル2とレベル12を辞書化してみましたが
よさげです



332:名無しさん@3周年
08/10/20 08:19:06 xZDxUpIK
ところがPDIC自身にそういう機能があるみたいではずしてたみたいです。

333:名無しさん@3周年
08/10/20 08:24:03 xZDxUpIK
>>332
こんなのもあるみたい
apsse/Gapsse
URLリンク(www.forest.impress.co.jp)

334:名無しさん@3周年
08/10/20 08:34:44 xZDxUpIK
>>333

GappsseでSVL取得してみましたが超便利でした。
このツールは使える。


335:124
08/10/20 21:13:45 VSuD4IvO
>>329
朝wikipediaを1万件ごとに変換しようとしたら、最初の1万件でクラッシュして終わりました。
原因は調べてませんが、かなり前に変換したときとは別方法なので、何か書式エラーかと。
時間があるときにまた試してみようかなと思います。

>>331
やったことはないので不確かですが、
PDICテキストからtsvにはepwing介さなくてもたぶん簡単に変換できるのでは?
そのほうが情報のロスが少なくてよさそうな気がします。

336:名無しさん@3周年
08/10/21 08:15:00 VyRG4OtV
PDICからtsvならExcelのマクロでも出来るんちゃう

337:名無しさん@3周年
08/10/22 20:48:33 eHKUzO3b
豚切りで悪いけど、電子辞書にエディタが搭載されるきっかけになってほしい。
キーボードが好みなので、できればSIIで。

URLリンク(www.kingjim.co.jp)



338:名無しさん@3周年
08/10/22 21:17:19 8AJTJwms
>>337
同じこと考えた
合体して欲しい

339:名無しさん@3周年
08/10/22 21:19:06 yyHncwW3
337
>URLリンク(www.kingjim.co.jp)

絶対売れない気がする。


340:名無しさん@3周年
08/10/22 21:34:54 8AJTJwms
山根一眞さんが買う

341:名無しさん@3周年
08/10/22 22:35:21 HL719oW+
ポメラ、ちょっとニッチな感じだしね。
売れるかどうかというとちょっと...。

自作辞書利用可という意欲的なS9000の後継機にこそ、
簡易なものでよいのでエディタを搭載して欲しいよ。


342:名無しさん@3周年
08/10/23 10:51:42 UPnZLHQc
エディタなんていらねぇけど?


343:名無しさん@3周年
08/10/23 20:02:50 0kb/XUYY
大変便利なepwing2tsvスクリプトありがとうございます。
便利に使わせてもらっています。

epwing2tsvはEXEになっていて他のファイルはスクリプトのままなので
当然ですがルビーのインストールが必要です。

他のファイルもEXEにしてもらうとさらに敷居が低くなると思います。
MeCabのインストール先はルビーからレジストリを参照すれば取得できると思います。
EXE化されればこれらのファイルを呼び出す簡単なWindowsのGUIを作ろうと思っています。
(MeCabのフォルダ名をWindows側から渡すようにする形もあります)

いかがでしょうか




344:124
08/10/23 20:42:59 3F8XB8FS
>>343
土日の時間があるときにやります。
今のところスクリプトの引数でmecabのパスを渡そうと思っています。

345:名無しさん@3周年
08/10/25 18:32:30 RmTmLXRY
>>344
ということは、epwing3tsv.exeって
もともとはrubyスクリプトなんでしょうか。
もしそうなら、お暇なときに
MacやLinux環境のためにrubyのソースコードを公開していただければ幸いです。


#rubyは正規表現が使いやすいから便利ですねー

346:名無しさん@3周年
08/10/25 20:02:12 Oe+QBTQk
>>343
URLリンク(siidict.net)
にイメージ画像をアップしました。

347:名無しさん@3周年
08/10/25 22:27:30 +SAvKuZ9
来年大学に入学するので大学生協で購入しようと思ってるのですが
この英語に特化したタイプの辞書って毎年モデルチェンジしてるんですか?

348:名無しさん@3周年
08/10/25 23:23:28 NppTCMuQ
>>346
すごいですね。
これがあると、さらにユーザ辞書利用の敷居が低くなって、
作る人も増えそうですね

349:124
08/10/26 02:02:36 ySxD6agz
>>329
いまさらですが、>>335で1万件の変換でクラッシュしたのは、
単にひらがな化し忘れてただけでした。最初の1万件だけですが変換できました。
残りはまだやってません。

>>345
epwing2tsvはCで書きました。rubyは最近始めたばかりなのです。
ruby便利ですよねー、次修正するときは、rubyで書き直す"かも"です。

>>346
いい感じですねー、
明日?今日中にはexe化します。

350:名無しさん@3周年
08/10/26 10:11:49 3MenByCq
>>349
Cをruby化すると10倍くらい処理時間が落ちる感じです。
Cで1秒未満の処理ならいいですが数十秒だとするとつらいかもです。
実際に作ってみないとわかりませんが

351:124
08/10/26 11:36:21 ySxD6agz
>>350
確かに速度は遅いですよね、
1.91に少し期待です。

今からuniqlink.rbのexe版upします。
hiraka.rbはスクリプト変更しなきゃいけないのでまだです。

352:124
08/10/26 13:34:32 ySxD6agz
すべてexe化完了し、公開しました。

353:名無しさん@3周年
08/10/26 18:54:32 X3tf7N2T
>>349
ありがとうございます。そうでしたか。。
win機も利用しようと思えば利用できるので、そちらで試してみることにします。

354:343
08/10/26 23:17:29 ouWvhg52
>>352
早々の対応ありがとうございます。
Windowsのソフトはインストーラ形式にする予定でスクリプトのEXEファイルも
インストーラに内蔵してしまえばさらに楽にインストール可能になると思いますが
いかがでしょうか。
インストール後にスクリプトのEXEファイルを個別指定できますのでスクリプトの
最新版にあとから指定し直すことも可能です。

テストバージョンは今週末か来月上旬にどこかにアップします。



355:124
08/10/27 21:35:02 G5TFBGVw
>>354
インストーラに内蔵してもらって構いません。
公開が楽しみです。

356:名無しさん@3周年
08/10/27 22:20:55 bQ9eZkad
>>354
個人的なことですが、
インストーラ付パッケージと
zipの2種類用意した方が好きです。

357:343
08/10/27 22:33:37 bY/qHlnZ
>>355
快諾ありがとうございます。
インストーラのサイズは1Mバイトくらいになりそうです。
あと01.txtや91.txtの欄はひとまず4つしか用意していないですが
5つ以上の可能性はあるのでしょうか?


>>356
zipバージョンも用意します

358:343
08/10/27 22:42:15 bY/qHlnZ
>>356
zipバージョンなんですが、現状ではレジストリへの書き込みをする予定でインストーラの場合は
アンイストール時に自動的にレジストリを消去します。

zipの場合アンインストーラがないのでレジストリ消去用のEXEファイルを同梱しますが
実行し忘れればレジストリは残ってしまいます。




359:343
08/10/27 22:45:28 bY/qHlnZ
>>358
レジストリではなくiniファイル方式で考えてみます。

360:124
08/10/28 06:50:34 ehX/x9Wu
>>357
00,04,05,0A,90,91,81で最大7つになります。
…そんなに指定する人がいるかどうか分かりませんが…。

361:名無しさん@3周年
08/10/28 11:53:34 9Q6Gpxto
・SII SR-E6000
・SII SR-S9000
で悩んでいますが中3だとSII SR-E6000が無難ですか?
一応御三家中学なのでそれなりのレベルまでは勉強しているつもりです。
今日学校の帰りに買おうと思っています。

362:名無しさん@3周年
08/10/28 14:58:13 Hl1sSRHf
>>361
中学生なら学生向けモデルの方がいいんじゃないか…。
E6000は英語の類語辞典が無いのが痛い。
S9000は英語を「用意された教材」ではなく
英字新聞やラジオなどの「生の教材」で学習する段階で使うレベルの機種だ。
TOEICで言うと800ぐらい。
別にそのレベルに達する前に買ってもいいけど、多分無駄かな。
価格.comで安い型落ちの学生モデルを買うことをお勧めする。

363:名無しさん@3周年
08/10/28 19:35:06 keZStXXM
>>361
SIIは漢和の検索性は悪いし(部品検索や手書きがない)、
古語辞典がないから国語の学習には向いていない
御三家難とかがどのくらいの中学なのかは知らんが
中学生にSIIの英語モデルは勧めない

もう買ったかもしれないけど
こういうのはネットで買った方が遙かに安いから検索してみれ

364:名無しさん@3周年
08/10/28 19:47:16 bb1FwkxO
>>363
SIIのS9000使ってる。古語に関しては、追加の辞書で投入したから問題なし。
英語に関しては、そこらの辞書より優秀
参考書等は、基本的に本で買うのを勧める。

漢和は、あまり引くことがない(熟語として引けばすぐ出るので)
漢文でも、中高生は大概専用の文法書で問題ないはず。
教科書等に注釈あると思うしね。

S9000のメリットとしては、他人と違った百科事典と、(←一人だけ検索結果が出るなんてことも)
英語の膨大な量(英作で役立つかも。膨大すぎてほとんど生かせないだろう)
って感じかな。PCがそこそこ使えるなら、自作辞書入れてみるのもいいかも

周りと同じのがいいなら、シャープやカシオの方がいいとは思うけど。

365:名無しさん@3周年
08/10/28 19:58:20 keZStXXM
>>364
俺も使ってるんだが、古語のシルカってあったっけ?
どこで売ってるか教えてくれ。不便で困ってる。

366:名無しさん@3周年
08/10/28 20:49:32 YfT7gM1/
>>357
おおお!zip感謝です!

367:名無しさん@3周年
08/10/28 22:28:35 bb1FwkxO
>>365
epwing形式の辞書を買って、変換した。
S9000だったらできる。
詳しくは、URLリンク(siidict.net)

368:343
08/11/06 19:42:15 /mpyqlCF
windowsのソフトを作っている>>343です。

ようやく動作テストができるようになりました。
テスト版公開までもう少しかかる感じです。ダウンロードページは以下になります。
URLリンク(kuma.kanpaku.jp)

satierさん header.datは*.txtのあるフォルダにないとエラーになるみたいですが
可能であればepwing2tsv.exeのあるフォルダから参照するほうがいいのかなと思いました。
機会があればご検討をお願いします。

今回は*.txtフォルダにheader.datがない場合はコピーるすように対応しました。



369:124
08/11/06 21:59:18 pEf4Gbgo
>>368
今週の土日には修正します。
それまでお待ちください。。

370:343
08/11/06 22:17:51 B4AEsC2A
>>369

たびたびすいません。
ありがとうざいます。

371:124
08/11/09 23:09:45 meURis9h
>>370
修正の話ですが、
土日に予定がいろいろ入ってしまいできませんでした。
火曜の夜にできると思います。本当にすみません。。

372:名無しさん@3周年
08/11/10 18:23:43 yozd2n2u
124氏、343氏
ご両人のすばらしい能力とボランティア精神に敬意を表します

373:124
08/11/11 19:29:26 vhC7CYOm
>>370
header.datのパスはargv[0]から取得するように変更しました。
output.txtはこれまで通りカレントディレクトリ(作業フォルダ)に出力します。

374:343
08/11/11 20:38:22 3JdMiKih
>>373
お忙しいところありがとうございました。
順調にいけば今日、明日くらいにアップしたいと思います。


ところでZIP版を希望された方、ZIP版のメリットって何でしたっけ?


375:343
08/11/11 20:45:11 3JdMiKih
>> 374 追記

ZIP版ですが

1、インストーラの実行ファイルそのものをZIPで圧縮したもの。
2.インストーラなしの状態でZIP圧縮したもの。

と2種類あると思いますが

1、でもよいのか2、のほうが良いのでしょうか?



376:名無しさん@3周年
08/11/11 22:04:04 aE/VXDic
ふつーzip版といえばインストーラ無しだね
自動でどこかにファイルを置かれたりするのがいやな感じ

377:343
08/11/11 22:09:55 3JdMiKih
>>376

了解しました。



378:名無しさん@3周年
08/11/12 00:05:16 ZFgv7WPO
>>377
ZIP版をお願いしたものです。
>>376さんの言われている通りです。
余計な手間を取らせてすみません。

379:343
08/11/13 23:44:28 KZP0M8Q3
アップしました。
URLリンク(kuma.kanpaku.jp)

380:名無しさん@3周年
08/11/14 02:47:14 jfsWI3c2
>>379
ご苦労様です~
ZIP版感謝です。
ありがたく使わせていただきます。
これでPC初心者にも自作辞書が普及すればいいですね~

381:名無しさん@3周年
08/11/14 06:03:55 5N/bcdT9
>>379
ほえ~お疲れさんです。使いやすそう。

382:124
08/11/15 19:24:50 1w401K5r
お疲れ様です。
私も後で試してみますね。

383:343
08/11/15 20:06:42 3RB3NN4J
どうもです。
現在微妙に変更中です。
新規フォルダをドロップしたとき自動でファイル名をリストするように変更中です。
Ver.0.8.0の部分をVer.0.7.0にすれば実行ファイルは取得できます・

384:名無しさん@3周年
08/11/17 21:33:00 y04mUfhq
URLリンク(www.besta.com.hk)
欲しいんだが買えるとこ知ってる人おらんと?

385:名無しさん@3周年
08/11/18 20:29:09 8oZtErXR
>>384
ココとか
URLリンク(aycts.cart.fc2.com)

386:名無しさん@3周年
08/11/26 00:29:49 Zv69kCrn
自作辞書機能つきの新機種が発表されたのに、のびないな。
このスレではG9001の話題はだめかい?

387:名無しさん@3周年
08/11/26 08:58:02 CvVpvtfl
ここは自作辞書機能付きの機種のスレではなく自作辞書機能のスレです

388:305
08/11/26 23:38:31 UtyN3yIm
>>343さん
siidict管理です。
変換支援ソフトについて少しですが書いておきました。
何か加筆・訂正等ありましたらお願いします。

掲示板にパスをかけました。荒らしが酷すぎたので。
パスはURLリンク(siidict.net)に書いてますので、そちらでご確認ください。
11月初めから、サイト上に広告が出て見苦しいかとは思いますが、
私の金欠のため無料サーバーでの運用にご理解ください。
年に一度のドメインの更新だけはさせていただくつもりです。

389:名無しさん@3周年
08/12/17 23:34:22 kIHG+ag+
保守age

390:名無しさん@3周年
08/12/17 23:34:53 kIHG+ag+
保守age

391:名無しさん@3周年
08/12/23 00:52:26 KqPg0i/A
自作辞書の例文検索は結構時間かかるね
内蔵辞書の検索は早いから、
検索速度を早くできる作り方があるのかな


392:名無しさん@3周年
08/12/30 22:51:46 vbRV2qw+
URLリンク(sekky.tripod.com)
sekky先生も自作辞書を試したみたい。
上の書き込みはひょっとすると先生かも

393:名無しさん@3周年
09/01/07 13:41:45 t6MFcivD
wikipediaを40分割にして変換してみました。
検索に数十秒かかってしまうことも多い上に
何十件か見ているうちにフリーズすることも多いです。

数字を使った検索が不可能なのと、
読みがhirakaで入れたものなので適当な部分はありますが、
一応見ると言うことだけは何とかできるかな・・という状態です。

394:名無しさん@3周年
09/01/07 15:25:11 bACZUxeq
乙!

395:393
09/01/07 20:17:52 t6MFcivD
ただやたら固まる・・・
リセットを何度したことか・・
もうちょっと電子辞書のCPUがちゃんとしてればいいんですけどね・・
それと、SDを高速タイプに変えたとして、検索速度に関係ある?
今は上海問屋×transcendのmicroSD 2GB使ってるけど

hirakaの精度的な問題だろうけど、「白い巨塔」が「しろいきょとう」ではヒットしなくて、
「しろい」で下の方にヒットしてるとか色々と不便な点は多いな。

396:名無しさん@3周年
09/01/14 23:43:47 xYke1ebe
>>395
内蔵検索ソフトにバグあるよね
内蔵辞書しか使わなくても変な表示になることがある


397:393
09/01/15 22:15:22 MeH3eacu
履歴を押したら、変な英字と
Fixed the bug and update
的なことを行ってくるんだけど、どうしようもない・・・

昨日はwiki入れて検索してたら、フリーズして、いつもだったらリセットで直るんだけど、
直らなくて、電池抜いたりカード抜いたりしたけどだめで、修理に出そうと思ってたら、
今日付けてみてたら正常に動作したり・・・

画面を高精細にしたから、ちょっとCPUとかが無理してる感じが否めない

398:名無しさん@3周年
09/01/21 23:02:37 Sk9jikG6
S9000はSL900Xに圧倒的に負けてるね

値段でも収録コンテンツでも

ははは、9000買ってしまった奴は糞だなあwww

399:名無しさん@3周年
09/01/22 07:29:41 qVw5Fter
それほどの差はないような

400:名無しさん@3周年
09/01/22 11:59:04 re1CKZWo
もういいって…マイペディアひとつでも大きな差なのに、広辞苑とか全然ちがうよ

401:名無しさん@3周年
09/01/22 15:37:25 2unAcEIS
>>400
英語モデルなのに英語以外を重視というわけですね。

402:名無しさん@3周年
09/01/22 23:30:35 Vbndagza
マイペディアが無いのは残念だけど、類語はほぼ使わないしなー。
カタカナ語はたまーに地味に役立つけど。
でも、広辞苑よりはまだ大辞泉の方がずっとまし。大辞林だともっといいけど。
広辞苑がいいと言ってる人達って引き比べたことあるのか、と思ってしまう。

403:名無しさん@3周年
09/01/23 01:27:37 xzzdiEw9
でも、6版になってだいぶましになったよ。

404:名無しさん@3周年
09/01/23 20:46:30 TeeDo86+
広辞苑がとにかくいいって人はどうなんだか・・
確かに「広辞苑より」て書けば箔は付くだろうけど、
意味の定義の仕方が古語的な感じで大辞泉とかのほうがわかりやすかったりする
大辞泉が格別イイとも思わないけど・・

俺は発売当初に買ったけど
値段はどちらもほぼ同じかS9000の方が安く(通販使えば)
広辞苑が嫌いだからS9000買った。

マイペディアってホントに必要か?
ブリタニカでかなりカバーできるし、欲しい人は
自作辞書でwikipediaでも入れれば検索速度は落ちるけど、
情報量は圧倒的だ。

405:名無しさん@3周年
09/01/23 20:53:10 xzzdiEw9
生物系が弱いのが難点。

406:名無しさん@3周年
09/01/24 03:12:12 HXtSIr3y
言葉の意味が知りたいだけなら広辞苑じゃないほうがいいんだが、
広辞苑は引用するときに便利だからはずせないだよ。

そんなことより、おまえら・・・

■ おすすめ2ちゃんねる 開発中。。。 by FOX ★
このスレを見ている人はこんなスレも見ています。(ver 0.20)
若い頃落合信彦の本にハマってた人 [30代]

407:名無しさん@3周年
09/01/27 21:16:52 XDDd6DF0
内容、操作性、共に文句なしだね。
ただ、バックライト欲しい。
うちの部屋は思った以上に暗かったようだ。。
正直見づらい。

408:名無しさん@3周年
09/01/27 21:21:49 j28a8NhJ
デスク用のライト買うと良いよ。 昔ながらのアームの奴でいいじゃん
2000円ぐらいで買える。 OHMの安い電球型蛍光灯付ければコスパ良いよ。

409:名無しさん@3周年
09/01/29 23:30:45 TylURil1
結局検索の優秀さはセイコーなんかな?

410:名無しさん@3周年
09/01/30 18:43:32 bvCMdSDe
今日S9000買ってきた
ヨドバシで31900円のポイント20%だから生協で買うよりお得かな
901の発売まで待てなかったよ・・・

411:名無しさん@3周年
09/01/30 19:06:11 2k0MXY7B
あほだな

412:名無しさん@3周年
09/01/31 00:06:42 7cUIMowe
>>410
微妙なタイミングで買ったなw
まあ、この手の商品は欲しいときに買えばいいよ

413:名無しさん@3周年
09/01/31 00:52:33 7cUIMowe
>>404
広辞苑は一つのブランド

「辞書」

広辞苑:ことばや漢字を集め、一定の順序に並べ、その読み方・
意味・語源・用例などを解説した書。辞典。辞彙。「―を引く」
「英和対訳袖珍―」
大辞林:多くの言葉や文字を一定の基準によって配列し、
その表記法・発音・語源・意味・用法などを記した書物。国語辞書・
漢和辞書・外国語辞書・百科辞書のほか、
ある分野の語を集めた特殊辞書、
ある専門分野の語を集めた専門辞書などの種類がある。辞典。
辞彙(じい)。語彙。字書。字引。
大辞泉:多数の語を集録し、
一定の順序に配列して一つの集合体として、個々の語の意味・用法、
またはその示す内容について記したもの。語のほかに接辞や連語・
諺なども収める。また、語の表記単位である文字、
特に漢字を登録したものも含めていう。辞書は辞典(ことばてん)・
事典(ことてん)・字典(もじてん)に分類されるが、
現実に刊行されている辞書の書名では、
これらが明確に使い分けられているとはいえない。辞典。字書。
字引(じびき)。

日国大:ことばや文字をある観点から整理して排列し、その読み方、
意味などを記した書物。外国語辞書・漢和辞書・
国語辞書などを含めていう。国語辞書の中には、普通のもの以外に、
百科辞書や地名辞書・人名辞書、また、時代・ジャンル・
作品などを限ったもの、各学問分野別に専門用語を中心に集めたもの、
方言・隠語・外来語など語の性質別にまとめたもの、
表現表記に関するものなど、内容上多くの種類がある。辞典。字引。
字書。字典。※以下、用例を省略

414:名無しさん@3周年
09/01/31 00:53:01 7cUIMowe
これだけを見れば、大辞泉が大健闘しているとわかる

ただし、広辞苑には
>ことばを書きつらねたもの。文章。蘭学事始「蘭学は実事を―にそのまま記せし者」
>〔言〕ある言語の語彙のすべてについて、一般的規則では扱えない音韻・統語・形態・意味上の性質を記述した文法モデルの一部門。レキシコン。
まで出ているが、上のは日国大だけ、下のは広辞苑にしか出ていない
大辞泉は類語の一つとしてレキシコンを挙げているが、大辞林はなし

何か一冊というなら自分の好きな国語辞典が収録されているモデルを
選べばいいと思う

しかし、こうやって引き比べられる環境を構築できるのもいい
俺は日国大、国語大、広辞苑(旧)、大辞林、大辞泉、言泉(紙)、
日本語大辞典(紙)、その他、いくつかの小型辞典を所有している
だが、俺はまだ広辞苑の最新版にアクセスできないでいる
だから、俺は広辞苑の最新版が収録されたモデルが欲しい

マイペディアは「主役」じゃない あくまでも「脇役」
だから、百科をそれほど必要としないやつにとっては
重視するポイントじゃないだろうな

415:名無しさん@3周年
09/01/31 01:08:50 i6lknj+I
広辞苑、マイペディア、とブリタニカあれば最高の愛

416:名無しさん@3周年
09/01/31 01:13:04 7cUIMowe
>>409
使い手を選ぶかもね、優秀=高機能ということだから
俺のイメージだと、SIIは「英語の用例検索が優秀」って感じ
そこを重視するなら、SIIだろう
というか、ここはSIIスレだから、それ以外の選択肢はないなw

417:名無しさん@3周年
09/02/19 21:43:55 L3bFDXkK
901X age

418:名無しさん@3周年
09/02/19 23:55:42 e1vopBjl
901内蔵メモリ減ってる・・・
安くなってるのに、妙なところで仕様変更してる
百科事典が一つ減ったのも残念

プラス面では、
辞書データが容量増えてるのあるみたい
英検・資格試験用が充実
新機能の使い勝手どうなのか気になる


419:名無しさん@3周年
09/02/24 08:52:24 smTzqO5J
あげ

420:名無しさん@3周年
09/02/24 19:05:52 VZjLaTpR
まげ

421:名無しさん@3周年
09/02/25 11:04:03 9wYFZNa1
最近SR-G6000M を買った者です。
セイコーさんのは検索速いし使いやすいのですが
シルカカードとSDは互換性ないのでしょうか?
フォーマットなどハックしてる人が居れば
このスレの自作辞書が入れれて便利だろうなぁ・・・
と思っていますが何かご存じの方おられます?

422:名無しさん@3周年
09/02/25 13:28:47 3OlzVLYp
ない

423:名無しさん@3周年
09/02/27 17:41:48 VcX4bX2b
いない

424:名無しさん@3周年
09/03/01 11:15:30 jvou3CyE
最近SL900xを買いました。
ウィキペディアを自作辞書にしたいのですが、
HONMON.ebzをどうしたらいいのでしょう?
こちらで紹介されているepwing2tsv支援ツール
でtsv化することはできますか?
初心者で申し訳ありません。

425:名無しさん@3周年
09/03/01 20:13:41 7juuul6p
>>424
できます。私が運営していた、やり方を詳しく説明しているサイトが
あったのですが、レンタルしていたxreaのs353サーバが故障し、
現在は見ることができません。バックアップを取っていなかったので、
復旧は未定です。手順を簡単に説明すると、
ebdump URLリンク(www31.ocn.ne.jp)
を使って、URLリンク(72.14.235.132)
のように4.まで行う。

URLリンク(kuma.kanpaku.jp)
から支援ソフトをDLし、さっきまで作ってたファイルをドラッグアンドドロップ
後は適当に実行するのみ。

426:名無しさん@3周年
09/03/01 20:32:15 7juuul6p
補足します。
私もwikipediaを変換しましたが、
変換、使用には難があります。
1:検索に数十秒かかり、暇つぶしに見る用途以外では使い物にならない
2:フリーズを起こすこともある
3:wikipediaのファイルサイズが大きすぎるため、
分割しないと作成できない(?)。よって結構めんどくさい。

427:名無しさん@3周年
09/03/01 21:22:27 2Xs+m5hS
wikipediaはどんどん増えていくからなあ

428:名無しさん@3周年
09/03/01 21:32:26 QI4HOZO5
これって分割すれば検索スピード上がるんだよね
かなり細かく分割すればいいんじゃないの?

429:名無しさん@3周年
09/03/01 21:37:05 7juuul6p
とりあえずsiidict.net復旧させましたが、記事は無いので
書いていただける方がいらっしゃいましたらお願いします。

googleに残っていたキャッシュ
URLリンク(www.google.co.jp)

430:名無しさん@3周年
09/03/01 21:45:28 7juuul6p
>>428
たぶん早くならないと思います・・
サイズ的に変換できないから分割してるだけで、
分割すればするほど変換がめんどくさいだけに思います。
あくまで自分が使って感じたことで、計測したわけではないですが。

431:Sekky ◆v3por7EIIw
09/03/02 17:27:06 Y4hr34nv
>>428

日本大百科全書のEPWING版を変換してみましたが,細かく分割しても目に見えて速くなることはありません。
一括検索の際などは,結局分割した全部を検索するので,日本大百科全書のところへ来るとスクロールが
フリーズしたようになりますし,個別検索でやろうとすると,細かく分ければ分けるほど,(紙の百科事典と同じで)
検索するものを選ぶのが面倒になります。

100数十MBの日本大百科全書でそうですから,Wikipediaは実用に耐えるかどうか(それ以前に,変換作業が
うまく行くかどうか)不安です。iPhoneの(英語版)Wikipediaをローカルに落として検索できるソフトは快適ですので,
これが日本語版Wikipediaに対応するのを期待したほうがいいのかもしれません。

432:名無しさん@3周年
09/03/03 00:02:30 KKMKvpoy
>>425さん、>>428さん、>>431Sekkyさん

みなさま、初心者の疑問にやさしく答えてくださってありがとうございます。
いま、ebdumpを使っているところですが、古いPCだからかもしれませんが、
かなり時間がかかっています。

ところで、Wikipediaのebzファイルは800mbを軽く超えてます。
やはり、実用にはかなり無理があるかもしれませんね。
ブリタニカ、マイペディアに加えて、時事にも強いウィキペディアが
入れられれば、自分的には最高だと思ったのですが…
ほかにも入れたい用語辞典や技術的なデータがあるので、地道に手作りしてみます。
英語学習というより、仕事や学校(社会人院生です)で使うポケットデータベース
の構築が目標です。


433:名無しさん@3周年
09/03/03 01:14:35 Wpb8/CeE
Wikipediaを持ち歩きたいなら、smarphoneの方が良いんじゃないかな。

434:名無しさん@3周年
09/03/10 23:21:03 S4xI7Kwy
自作の辞書を作ろうと思ったんだが、画像の4bitグレースケールってどうやって変換すれば良いんだ?
どの画像編集ソフトも8bitにしか対応して無くて、4bitにすることができない。
なんかいいソフトあったら教えておくれ。

435:名無しさん@3周年
09/03/11 03:06:24 sKWwe+Ub
IrfanViewでいいかと

436:名無しさん@3周年
09/03/11 03:26:33 sKWwe+Ub
ていうか一発で4bitグレースケールにしようと思ってるの?
グレースケールは8bitが当たり前
グレースケールにしてから16色に減色するんだよ

437:名無しさん@3周年
09/04/03 10:46:54 dI9lFn4n
ところでニコ厨的な発言で申し訳ないんだが
ニコニコ大百科は辞書変換可能ですか?
URLリンク(dic.nicovideo.jp)
記事は4万件程度でなかなか良い暇つぶしには最適かと


438:名無しさん@3周年
09/04/22 20:58:40 ru7lps68
シルカカード買ってみた
端子が4つ多い

データ構造調べるのは無理みたいだね

439:名無しさん@3周年
09/04/29 21:23:35 y9+dfbVd
>>437
データが決まったフォーマットで公開されているなら可能。
wikipediaは全ページのデータがダウンロードできるが、
ニコニコ大百科ではたぶんそういうのはないと思われ

440:名無しさん@3周年
09/05/19 22:22:29 OZ15XOK6
wiki丸ごと入ったら最強の辞書になるなぁ。
単語帳みたいなのを作成したいけど、わざわざExcelで作って変換してってのが面倒くさくて
結局ノートに書いてて自作機能をまったく使ってない・・・。


441:名無しさん@3周年
09/05/19 22:57:13 oO6uDeLz
Wikipediaを入れることができるならやり方が詳しく乗っているサイトってありますか?
あったら教えてほしいです

442:名無しさん@3周年
09/05/20 18:05:48 63Tb99pV
>>439

抽出するプログラムでも書いてみるしかないか…

443:名無しさん@3周年
09/05/27 21:22:45 IwIvU9w6
誰かwikiのバックアップとか持ってない?
epwingのえいじろうのサンプルためしに入れてみたいんだけどわからなかった…

444:名無しさん@3周年
09/06/04 00:06:24 Y9QIM4hi
wikiをオフラインで使いたいなら、こっちの方がいいような気がする。
URLリンク(bitli.blog36.fc2.com)

445:名無しさん@3周年
09/06/22 01:16:03 TGss7pKO
自作ドリル作ってみた
法律の短答問題集をOCR使って元データにし、
これを変換したら、エラー無くあっさり完成してしまった

自作辞書よりずっと楽だね
ドリルの使い勝手もなかなかいい

446:名無しさん@3周年
09/06/24 01:46:23 YRbeEc90
自作ドリルすごく便利
日本語OCRの精度がいまいちなのが残念だけど

日本語OCRって、10年前から大して精度上がってないね

447:名無しさん@3周年
09/06/24 18:19:37 EGyKf18/
(´ι_` )あっそ

448:名無しさん@Linuxザウルス
09/07/13 08:12:00 87eIv9Xw
こんなところに
あっそう総理が

449:名無しさん@3周年
09/08/11 04:12:15 QTJ3Of6R
SDカードを高速の物にしたら、
自作辞書の検索速度アップするのかな
内蔵辞書に比べてかなり遅いよね

450:名無しさん@3周年
09/08/15 18:40:47 FDHyrpcs
自作辞書って、ハングルも対応してるの?

同時進行で勉強してるので、出来ればひとつにまとめたい。
ハングル辞書はヌリアンを使用してるのだけど。

451:名無しさん@3周年
09/09/13 00:50:46 UvU/GRhW
epwing2tsvの作者の人、まだこのスレ見てくれてるかなぁ。

epwing2tsv(002d)で、wikipediaのdumpファイル(00.txt,91.txt)を変換をすると、
body.tmpとtitl.tmpが出来るのだけど、
その後エラーが出て、output.txtが出来ません。

body.tmpのサイズは1.51G
titl.tmpのサイズは12.4M
です。

we2tを使用しても同じような結果です。

この二つの出力ファイル(body.tmp,titl.tmp)から、
output.txtを作成するにはどうしたらいいでしょうか。


452:名無しさん@3周年
09/09/13 01:24:47 UvU/GRhW
ちなみに、
00.txtのサイズは3.02G
91.txtのサイズは1.06M
です。

変換元のwikipedia(epwing化したもの)は、
下のサイトで配布している、8/31分(最新版)のです。
URLリンク(www.border.jp)

453:名無しさん@3周年
09/09/13 11:43:35 UvU/GRhW
EBdumpを最新版(ver 1.28)に変えたら、
正常にepwing2tsvを使えました。

お騒がせして、申し訳ありませんでした。


454:名無しさん@3周年
09/09/16 00:03:25 bdOpRbpt
例文は辞書容量を激増させるみたい

例文ばかりの辞書で、
試しに例文を本文のところにまとめてみたら、
容量が1/3になった


455:名無しさん@3周年
09/09/20 11:56:09 NkhB1SFK
自作辞書の本文に<p>とかの表記をしたい場合、
どうすれば可能ですか?

辞書作成ツールのタグと同じなので、
エラーになってしまいます。

456:名無しさん@3周年
09/09/20 17:01:32 NkhB1SFK
動作速度がちょっと遅めだけど、
何とか実用的な範囲内の速度で使えるwikipediaを作れそう


457:名無しさん@3周年
09/09/20 22:36:57 NkhB1SFK
1つの言葉調べるのに、数秒って感じ

他辞書などの文中語句からジャンプで探すと、
15~20秒程度


458:名無しさん@3周年
09/09/21 06:23:28 WJKs53/b
ストレス有りすぎじゃないかい?

459:名無しさん@3周年
09/09/21 17:01:35 pP/gs6Ps
>>458
自作辞書使うと、
例文検索でも数十秒かかること多い
(数十万例程度の例文辞書で)

自作例文辞書を普段使っているけど、
慣れてしまえば、このくらいは大丈夫だよ
なんといっても、電車の中とか、どこでも使えるのが大きい

itouch使ってepwingでもいいけどね
これなんか、辞書として使っても、すごく便利そう
URLリンク(jp.kohjinsha.com)
店頭で実物使ってみたけど、SIIの電子辞書に似てた


460:名無しさん@3周年
09/09/21 18:08:30 WJKs53/b
epwingなら、zaurusのほうがよくない?


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch