【辞書自作】SR-S9000 SL900X【SII 電子辞書】at DGOODS
【辞書自作】SR-S9000 SL900X【SII 電子辞書】 - 暇つぶし2ch221:名無しさん@3周年
08/09/04 16:03:27 hmGuOEDt
ひきつづき 217 です

>>218 220 返事ありがとうございます

unable to open source file : 00.txt と表示されます。text は 掲示板への自分の記入ミスでした。

とりあえず、自分の全工程を記入しますので、何かミスに気がつきましたら、どなたかアドバイスください


ebdumpの内容 

①honmonファイルの指定
②書籍構成要素で[00] [90] [91] を選択
③[00] [90] [91]を選択したときの、blks= aaaa の数値を 出力ブロック数(N)に設定
④出力ファイル名を、00 90 91 に指定
⑤記述子(1)で、テキストダンプ実行

00 90 91 txt ファイルの完成

①~⑤まで以外の、設定が必要でしょうか。もしかしたら、infoblock の数も設定が必要でしょうか。

新規ファイルに、00 90 91 txt と epwing2tsv.exe と headerというやつを入れました。

コマンドプロンプトを開いて、epwing2tsvのあるディレクトリーに移動。

epw2tsv sourcefile ・・・

epwing2tsv.exe 00.txt 90.txt 91.txt を入力

unable to open source file : 00.txt と表示されます。

以上に、なります。よろしく、お願いします。

222:124
08/09/04 20:11:13 uEzbZr/A
>>221
④の出力ファイル指定のところで、拡張子(=.txt)が抜けていると思います。
省略して書いているだけかもしれませんが、それ以外に原因が思い浮かびません。


ちなみに今日は、SIIのツールで大きなファイルが変換できない原因が分かりました。
今からSIIに連絡してきます。

223:名無しさん@3周年
08/09/04 20:20:08 /6MVihz4
>>222
おお!原因分かったんですか!すごいですね。

>>221
ファイル名が誤っているんだと思いますよ。
ウィンドウズの設定で、ファイルの拡張子を表示するように設定して、ファイル名の確認をしてみたらどうでしょう。

224:名無しさん@3周年
08/09/04 20:46:52 hmGuOEDt
>> 222 223 返事ありがとうございます。

ご指摘の拡張子のチェックしました。.txt と表示されました。

とりあえず、パソコンを変えてやってみることにします。

ながながとお付き合いください、ありがとうございました。

225:名無しさん@3周年
08/09/04 21:29:22 hmGuOEDt
224です 

進展ありました。
新規ファイルへの移動が、うまくできていませんでした。

今度は、ファイルへ移動してから、epwing2tsv.exe 00.txt 90.txt 91.txt 入力。

processing file 0x00 ... error. と表示された後、その新規ファイル内に
二つのtit.tmp ファイル body.tmp ファイルが作成されました。

う~ん。。。。なぜだろう。。。。



226:124
08/09/04 22:06:31 uEzbZr/A
>>225
tmpファイル類は、メモリに置かなくても済むように一時的に作成しています。

とりあえず、error表示の後に、
echo %errorlevel%
を実行して表示された番号を教えてください。
プログラムを見直しましたが、2と出ているはずです。

だとすれば、<4RBL>や、<何か>などのような、
半角<>に囲まれた十六進数でない内容がファイルに含まれているのだと思います。

EPWINGでは、本文の内容の半角文字は全角化されて格納されていると思うのですが、
そうでない場合もあるのでしょうか…。それとも文字コードの問題かな…。

たぶんepwing2tsvのバグだと思うので近いうちに直します。


227:名無しさん@3周年
08/09/04 22:16:41 hmGuOEDt
>>> 226

error の後、echo %errorlevel% と入力で、ご指摘のとおり 2 と表示されました。

自分は、パソコンの知識はないので、これ以上はファイルの修正できそうにないです。

それにしても、すばらしいソフトです。

何度もお騒がせいたしました。


228:124
08/09/04 22:44:01 uEzbZr/A
エラーを詳しく表示するようにしてをupしましたので、
時間があるときにでも実行してみてもらえますか?

私は朝早いので今日はもう寝ます。おやすみなさい。

229:名無しさん@3周年
08/09/04 23:10:05 hmGuOEDt
>>228 たびたびのご返事ありがとうございます。

エラーの詳細がでました。

epwing2tsv.exe 00.txt 90.txt 91.txt
row 2706: error converting hex <BL$H>
error.

自分の質問ばかりで、すみません。。。

230:名無しさん@3周年
08/09/05 14:17:27 ARx65l5T
00000321 行目 例文に空白があります。
00000321 行目 本文がありません。
00000358 行目 不正なタグがあります。

みたいなエラーが出るのだけど、
その部分だけ抜き出して変換するとエラーにならない・・・
SII提供ツールに色々問題ありそう


231:名無しさん@3周年
08/09/05 15:40:48 ig0ck/rv
>>230
変換ツールは融通が利かないからなぁ


232:名無しさん@3周年
08/09/05 15:59:43 eYw2RsmO
SIIさん、がんばってくらはいよ~
自作辞書は業界ではタブー的な位置で微妙かもわからないけど、なんか作ってくらはいよ~。


233:名無しさん@3周年
08/09/05 19:40:28 7QtJobt6
>>229
epwingの内容に意味不明なタグ(っぽいもの)が紛れ込んでいるみたいですね。
とりあえず、意味不明なタグは解釈しないでそのまま出力するように明日中には変更します。

234:名無しさん@3周年
08/09/05 23:08:39 ARx65l5T
エラーが出ても辞書作成できたので使ってみたら、
改行やタブがちゃんと認識されていない箇所続出
一部がソースのままデータになっていたりする
SIIはツールのバグ直してくれるのかなぁ


235:名無しさん@3周年
08/09/05 23:17:46 ARx65l5T
ソースに「"」を一つ付けだだけで挙動が劇的に変わった
どうなってるんだか・・・


236:名無しさん@3周年
08/09/05 23:23:50 ARx65l5T
「"」が対になっていないとエラー引き起こす?
全部対にしたらエラー消えた


237:名無しさん@3周年
08/09/05 23:28:10 ARx65l5T
「"」で消えたのは、
  00000028 行目 各項目は最大4,000文字です。
というタイプのエラーのみ


238:124
08/09/05 23:59:30 7QtJobt6
>>237
epwing2tsvで変換して、
その後エディタで、「"」 -> 「""」
と変換したということですか?

もしそうなら、epwing2tsvのバグでもあります。
””変換は実装したはずですから。

239:名無しさん@3周年
08/09/06 00:34:55 vX1uwmCK
>>238
epwing2tsvは正常に動作しています。

その後、txtファイルをexcelで読み込んで書き出して・・・とやっている間に、
"が""""""みたいになっていき、
その部分を手動集成している内に"がエラー状態になっていました。

excelは他にも色々問題ありますね・・・
txt読み込み時に;を区切りにしても、
たまに区切ってくれなかったりとか

240:名無しさん@3周年
08/09/06 00:52:22 vX1uwmCK
やっと、E-DICの例文を変換できた!


241:名無しさん@3周年
08/09/06 00:57:04 gTwDy34l
>>232
> SIIさん、がんばってくらはいよ~
SIIさん、Macもよろしくおねがいします!
入力ファイルがXMLもありだったりするとさらに嬉しいです。

242:124
08/09/06 01:18:02 HtUug95j
>>239>>240
バグではなかったようで安心しました。
うまく出来たようでよかったですね。

243:名無しさん@3周年
08/09/06 01:40:13 vX1uwmCK
別の辞書の変換をしていたのですが、
epwing2tsvが途中で落ちてしまうみたいです。

> C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
> processing file 0x00... done.
> processing file 0x91... done.

ここで、「問題が発生したため、epwing2tsv.exeを終了します。」のダイアログが出ます。
で、上に書いてあったエラーレベル表示をしてみると、

C:\epwing2tsv>echo %errorlevel%
-1073741819

でした。


244:124
08/09/06 02:06:26 HtUug95j
>>243
それでエラーが特定できるか分かりませんが、
とりあえず調べてみます。

たぶん同じようにエラーは出ると思いますが、
少し前に一部修正したものをupしたので一応試してみてください。

245:名無しさん@3周年
08/09/06 02:40:56 vX1uwmCK
>>244
よろしくお願いします。
上に書き込んだ結果は直前にダウンロードした最新版での結果です。


246:124
08/09/06 02:46:09 HtUug95j
>>245
後、<1F41><1F61>の検索キー記述子が、
00のファイルにあることを確認してもらえますか?

247:名無しさん@3周年
08/09/06 03:12:12 vX1uwmCK
>>246
その二つはありました。


248:124
08/09/06 03:39:13 HtUug95j
>>247
原因は大体分かりました。
数日中に直せると思います。

249:名無しさん@3周年
08/09/06 03:43:31 vX1uwmCK
>>248
素早い対応ありがとうございます。
よろしくお願いします。


250:124
08/09/06 13:20:50 HtUug95j
>>249
少しエラー処理を修正してupしました。
これでも変換できるようにはなりませんが、
ダイアログが出て終了ということはないと思います。

これでもう一度、表示内容と、%errorlevel%を教えてください。

251:名無しさん@3周年
08/09/06 13:58:53 vX1uwmCK
>>250
早速の対応ありがとうございました。

以下のようになりました。
C:\epwing2tsv>epwing2tsv law8-00.txt law8-91.txt
processing file 0x00... done.
processing file 0x91... done.
writing to file: output.txt
C:\epwing2tsv>echo %errorlevel%
-1073741819

前回と違うのは、「wrting to file...」の表示がされてから、
エラーダイアログが出たということです。
(前回はwriting to...は表示されませんでした)
よろしくお願いします。


252:124
08/09/06 14:58:26 HtUug95j
>>251
思っていたより厄介で、時間が掛かるかもしれません、、

たぶんwriting to~の前のどこかで、
文字列のオーバーフローでメモリ領域をぐちゃぐちゃにしてるのかもしれません。

コードを整理しながらじっくり見直さないとだめみたいです。
数日中には出来ると思ったのですが無理だと思います。すみません。

253:名無しさん@3周年
08/09/07 22:14:25 PdUh82vj
他の辞書でも似たようなエラーが出ないか確認してみました。

90と91両方出力可能な辞書のダンプファイルを用い、
  00 90で実行すると似たようなエラー
  00 91で実行したら、エラー無く完了

echo %errorlevel%の数値も251と全く同じでした。

>>252
大変そうで申し訳ないです。
よろしくお願いします。


254:名無しさん@3周年
08/09/07 22:43:28 qxTYDd3a
せかして悪いけどwikipedia電子辞書搭載は可能そう?
糞重くてもいいから…

せっかくG10000買う決心付いたのに揺らいだジャマイカ

255:名無しさん@3周年
08/09/07 23:20:34 PdUh82vj
現状のSIIツールの状態では、
wikipediaの変換はエラーになるんじゃないかな。
出来てもまともに機能し無さそう。

自分の場合、Longmanを変換しようとしたら、
例文数10万制限にかかって分割しないと変換できなかった。

半分に分けたらエラーは出ないで変換できたものの、
電子辞書上で検索すると大量の文字化け発生。

さらに検索結果から選択して例文を表示させると、
プログラム実行エラーになって、
そのまま電子辞書自体が落ちたことが何度も。

どうやら<I>タグが大量にあると、
こういうことになってしまうみたい。
エラーが発生したデータでは、10万以上<I></I>が使われていた。
これを削除して変換したら、
文字化けしない正常動作する辞書が出来た。


256:名無しさん@3周年
08/09/07 23:26:43 qxTYDd3a
>>255
トンクス

ついでにもひとつ
・テキストビューワ
・MP3プレイヤー
この二つはソフトなしで、SDにつっこむだけで使えるの?
マカーなのでソフト使えないんだが

257:名無しさん@3周年
08/09/07 23:49:28 PdUh82vj
>>256
自分が持っているのは大学生協モデルのSL900Xですが、
自分の機種では使えています。

テキストビューワは、ファイル名を~.txtにして入れるだけ。
テキスト中の語を検索語にして、
辞書で調べながら読むことが出来ます。

MP3プレーヤーもファイル入れるだけです。
320kまで対応していました。
電子辞書本体をパソコンにつないでも、
SDカードに書き込めないので、他で書き込む必要はありますが。
内蔵メモリーは128Mで、その範囲ならパソコンから直接書き込めます。


258:名無しさん@3周年
08/09/08 04:10:56 oeCOTHZi
SIIの辞書ツール、10M程度のソースの変換に、
200M以上メモリー使ってるんだけど、
wikipediaの様な巨大ソース変換させたらどうなるんだろう・・・


259:124
08/09/08 05:22:49 uNysGGH2
>>253
自分でもエラーが出る辞書探しながらやってみます。

>>254
出来る可能性が数%あります、という程度です。
正直自分でも分かりません。

>>255
変換できても辞書で動かないこともあるんですね…。
usrファイルってどういうフォーマットなんだろう。

>>258
700Mぐらいのファイルで2.5G以上使うみたいです。
使ってるPCが物理メモリ1.2Gなので、スワップしまくりで
3日ほど放置しましたが、変換が終わりませんでした。

260:124
08/09/08 08:27:57 uNysGGH2
今、wikipediaの最初の10万件を変換してみました。
メモリ使用量は約1.3G程度でした。
PenM 1.6GHzのCPU時間で1時間掛かりました。
変換前容量は260M、変換後は95M

このデータは、DDwinの出力を処理してmecabで読みを振った、
前に作ったデータです。そのためリンク情報等は含まれていません。

結論ですが、使い物になりません。
1つの検索に約20秒かかります。

このデータためしに使ってみたい人いますか?
夜なら、wikipediaなのでGFDLにしたがってupできますが。

261:名無しさん@3周年
08/09/08 13:00:30 oeCOTHZi
10M程度のファイルで、エラーも出ないのに、
一晩かかってもSIIツールでの変換が終わらないのがあります
SIIツールは完成度があれですね・・・


262:名無しさん@3周年
08/09/08 16:38:02 TVpyNXxt
SII がんばってくらはい!

263:名無しさん@3周年
08/09/08 23:56:22 oeCOTHZi
共に簡単に変換できる2Mと5Mのファイルを一つにまとめたら、
変換にかなり時間がかかった。
データファイルサイズが7Mなのに、
変換時に960MもRAM使うし・・・

例文検索用辞書を作るだけなら、
細かくファイル分けして、
小さい辞書をたくさん作った方がよさそう。


264:名無しさん@3周年
08/09/09 02:20:36 a1SLp+4C
インデックス作成時に莫大なメモリを使うのは仕方ない面もあると思う。
検索機能が優れているだけに。

推測だけど、

例えば、単純に処理すると、インデックス作成は、
「検索されうる単語の種類」 x 「見出し語の数 (or + 例文の数)」
だけのマトリックスを作ることになる。
つまり、「どういう文字列で検索されたら => どの見出し(or 例文)」っていう対応表。
だから、元の本文ソースよりは遥かに大きなメモリが必要。
あちこちに頻繁に出てくる単語もあるので、ソースを分割しての処理も難しい。

265:名無しさん@3周年
08/09/09 02:22:29 a1SLp+4C
メモリが1GBとか2GBしかないマシンだと、スラッシングが起きてると思う。
メモリの内容をディスク上に退避 & 退避してたデータをメモリに読み込み、
の動作だけでマシンの能力のほとんどを使い切っている状態。
これが始まってしまうと本来の作業はほとんど進まないから、かかる時間は急激に増大する。

元データから、どれくらいのメモリがあればインデックス作成できるかの目安があるといいね。
一概に言えないところではあるだろうし、ソースサイズの2乗で効いてきそうだけど。

(と言って、SIIツールは完成度が高いと言う気はさらさらないですが。)

266:名無しさん@3周年
08/09/09 02:28:33 a1SLp+4C
あと、仮に、上の様な処理をやっているのだとして、
最終的にはインデックスデータをコンパクトな形式に(いわば)圧縮する筈だけど、
その際にも、インデックスに入るデータの全体像が見えてないと「圧縮」というか、
できあがりインデックスを効率良く詰めて作れない、ということもあると思う。

267:名無しさん@3周年
08/09/09 04:20:55 4q5qYDSl
E-DICの例文辞書作成出来ました。
複数辞書ファイルがあっても全て検索してくれるので、
細かくファイルを分けて正解でした。

本体内蔵メモリーよりSDカードに入れたときの方が、
反応が速い気がしたけど気のせい?
検索速度は内蔵辞書よりちょっと遅いかな、といった程度。
十分実用範囲内です。


268:名無しさん@3周年
08/09/09 11:31:32 WJE9rjtp
SIIさん お疲れ様です。
開発頑張ってくらはい。

269:名無しさん@3周年
08/09/10 04:11:22 fLs9Tx13
そういえば、自作辞書が使える辞書にSR-S8100が増えてるね。

それよりはやく、辞書作成するソフトを更新してほしぃ

270:名無しさん@3周年
08/09/10 10:20:30 TdhjWQuu
>>267
おぉ、これを入れれば日本語例文検索ができないという唯一の欠点を
補える。本当はソフトのアップグレードで搭載コンテンツからSIIに
対応してもらうのが一番いいんだけどね…

271:名無しさん@3周年
08/09/10 10:34:05 NyrtNviq
4GBのSDカード使っても、2GBしか認識されないのかな?

272:名無しさん@3周年
08/09/10 14:16:22 z09qCgVD
Cobuild3版のwordbankを変換してみました。

EBDumpの出力は00しか出来ない(90,91が無かった)ので、
epwing2tsvは使えませんでしたが、
Rubyを使ったCobuild→EPWING化ツールの出力結果が、
1行1例文?という非常にシンプルなものだったので、
それを利用したら、簡単に例文辞書化できました。

30万行あったので数万行ずつ小分け。
例文検索も比較的素早くできているようです。

ただしRubyによる変換ツールの出力結果は、
一部おかしい部分もある様子。


273:124
08/09/10 15:36:19 FK1M7aXc
>272
00だけのepwingもあるんですね、
知りませんでした。

274:124
08/09/10 15:45:02 FK1M7aXc
ちょっと考えてたんですが、
weboxとか巡集とかで取り込んだサイトを、
電子辞書でリンクたどりながら見れたら面白そうですよね。
私はしばらく実装してる暇がないのですが。

275:名無しさん@3周年
08/09/11 01:56:59 00Kr+3Mj
00 90 91 txtファイル作成から、コマンドプロンプトで、

processing file 0x00 ... done.
processing file 0x90 ...

と表示され、tmpファイル2つできます。

echo %errorlevel%を入力すると、10 になりました。

原因は、何でしょうか??

276:124
08/09/11 05:11:45 QTgGlywC
>>275
90のファイルは、途中から
C0:あ[2] [1C79:11E][14F88:02]
00:ああ[4] [1D:166][14F88:7B6]
のような書式になってるはずです(80:で始まる行は無視しています)

[2]や[4]の後にタブがあるはずなのですが、ない行があると10を返しているようです。
本来もっとちゃんと処理すべきところですね。
週末あたりに、「メッセージ出してその行を飛ばす」ように書き換えます。

277:名無しさん@3周年
08/09/13 10:06:51 GoMNFI1q
大辞泉か広辞苑かと言うのは悩むね

278:124
08/09/14 14:27:42 B+Q93BcR
>>275
とりあえず更新しました。
エラー出ている行を飛ばしているだけです。
表示された行を探してその周辺で、書式を確認するといいかもしれません。

279:名無しさん@3周年
08/09/14 15:17:04 bNB/x5j8
広辞苑=時代順に意味が載ってる。左翼
大辞林=頻度順に意味が載ってる
大辞泉=カラーで図が多い。大辞林と同じ人が作ってる

程度な印象。あってる?

280:名無しさん@3周年
08/09/14 16:14:02 K7Nw6Qvz
>>278 さっそくの更新ありがとうございました。

無事、output.txt が出来ました。
さっそくoutput txt を クリエーターで .usr ファイルに変換しました。

本体で、そのファイルを検索してみたのですが、検索ができません。
分類別検索でみると、すべて文字化けしているようです。

ともかく、output txt は無事できました。
ありがとうございました。

281:名無しさん@3周年
08/09/14 19:41:26 u1R7hnWR
広辞苑ってそんなにいいか?
特に悪いということはないけど
特に良いとも思わないのだが

282:名無しさん@3周年
08/09/14 19:50:52 CQTA+5tX
まあ、詳しいことは載ってないわ、意味わからない説明だわってのはあるよね。



283:名無しさん@3周年
08/09/15 22:12:07 pWiyS9/t
その三冊の中では個人的には大辞林がだんとつ。ただの字引ではなくて、
百科事典的に作っているから、初めて見る単語(経済用語とか)を引いたとき
とても役に立つ。
広辞苑と大辞泉はあまり比べられない。ただ、改訂直後というのは魅力ではある
こないだ、大辞泉、広辞苑(旧版)搭載機種では意味すら出てこなかった単語が、
大辞林でそこそこ詳しく出てきたのに感動した

284:名無しさん@3周年
08/09/16 13:19:23 1sJ7i3yN
他スレから紹介されてここにきました

初歩的な質問ですが
SR-S9000 SL900Xでは
この電子辞書にさらにコンテンツ加えて
マイ辞書を作れるものでしょうか?
そういうのって出来ますか?
CD-ROMやダウンロードからででも
そういうのできる最適の機種あったら教えていただけませんか?
英語で気に入った英々辞典入れたいんですが
全部気に入った辞書コンテンツ入ってるのってないんですよね
探した限りでは

285:名無しさん@3周年
08/09/16 13:54:06 j8d7b/dY
そういうのはカシオの得意分野なんじゃないの?

286:名無しさん@3周年
08/09/16 16:06:12 KIghNMhp
>>284
まずどの英英を使いたいのか書くべき

287:名無しさん@3周年
08/09/21 23:46:03 PhO4uqdZ
進んでいるようですねー

ソフトウェア開発これからもがんばってくださいー

288:名無しさん@3周年
08/09/22 08:30:51 lnlDvjqB
この機種に日本語キーワード例文検索がないのは残念。
学習者向けには便利な機能なはずだが。
そこで、ユーザー辞書を追加して代わりをしたいんだが、
お勧めの辞書ある?
また、それを英活の訳語検索と一括で検索出来たりする
方法はある?

この機能が購入を踏みとどまってしまう唯一の点。
G10000の後継機では対応してくるかな。
G大、英和大、英活、COBUILD、Wordbankで日本語例文検索できたら
ものすごい。って英英は無理か

289:名無しさん@3周年
08/09/24 05:29:20 SP7VVcF1
社員さんがんばってください

290:名無しさん@3周年
08/09/26 14:09:40 7yddEo/2
うらーーー
ソフトの開発の方はどうですか?

291:名無しさん@3周年
08/09/28 03:19:09 S8TA4D6D
URLリンク(www.alc.co.jp)

前の書き込みでSVLの単語辞書を作った人いたけど、やっぱ手打ちでいかないと
作れないかな?これを単語帳にできるとSL900Xがますます手放せなくなると
思うんだけど。

292:名無しさん@3周年
08/09/28 10:55:14 z+jFpyym
>>291
コピーしてexcelに貼付ければいいんじゃまいか
いや作ったこと無いが

293:名無しさん@3周年
08/09/28 13:44:10 S8TA4D6D
>>292
英単語は簡単に貼り付けられるけど、和訳が問題。
Lingoesで表示された英辞郎の訳をコピペして作ろうかなと思ったんだけど、
膨大な時間がかかりそうだからさぁ。
上級の3000語程度ならなんとか手作業でできなくもないけど。

294:名無しさん@3周年
08/10/01 21:19:46 wT1o4rzM
>>291
学辞郎→PSS変換→エクセル整形で自動です。

SVL入れてからは、
 覚えていない単語のSVLチェック→例文検索→単語帳登録
のコンボをしてます。

メーカーには単語帳の登録制限を無くして欲しい。

295:名無しさん@3周年
08/10/02 02:07:54 eH19xvb5
>>294
学辞郎持ってたんですね。
俺はもうめんどくさいんで、SVLの単語集を買ってきちゃった。
でもSVL単語辞書を作ったら需要ありそうだよね。
人海戦術で作れば作れないこともないでしょ。
このスレにいる人だったら、必要だとしても上級3000語ぐらいで十分だろうし。

296:名無しさん@3周年
08/10/05 11:55:24 CYIP1sg9
epwing2tsvを使わせていただいたのですが、
見出し語に漢字や記号が入ってしまい、無効になってしまう語があるのですが、
どうにか成りませんか?

297:名無しさん@3周年
08/10/05 14:32:22 wjgkJsyk
オリジナル単語集が作れるように
メーカーにはTOEICテストボキャブラリーに採用している
単語集形式の作成ソフトを公開して欲しいなあ。
ドリル作成ソフトを使うと、ジャンプ機能が使えないから。
自分にとって、神機寸前なので。


298:124
08/10/06 04:37:57 DmXkx2tD
>>296
最近ruby勉強しながら、ひらがな変換するスクリプト書いてます。
いつ完成するか分かりませんが…。

299:名無しさん@3周年
08/10/06 13:51:40 K/hQ9Qzy
>>298
早く完成させろや禿げ
あっすいません
お願いします^^

300:名無しさん@3周年
08/10/06 19:36:01 RWiX2gGq
>>298
なんかすごいですね。期待してます。
自分の場合は、平仮名以外を除外するようにしていただければ十分です。


301:124
08/10/07 15:44:53 ctM9Sr9k
想定外に早く出来てしまいました。
rubyだと楽でいいですね。

とりあえずupしました。
rubyとmecabが必要です。

302:名無しさん@3周年
08/10/07 19:38:51 bt+h/dbU
>>301
お疲れ様です。
辞書作成付きの上位機種が出たら使わせて頂こうかと。

303:名無しさん@3周年
08/10/08 09:36:54 7AABJoIs
>>301
なんかすごいですね。
自分もプログラミングできるようになりたいです。

304:名無しさん@3周年
08/10/08 14:34:11 7AABJoIs
>>301
動作確認しました

すごいですね。感謝します。

305:名無しさん@3周年
08/10/13 20:51:01 De83UUnG
siidict.netを少しは書きました^^
変換できた辞書、出来なかった辞書等の情報がありましたら、
書いて下さると助かります

URLリンク(siidict.net)

306:124
08/10/14 10:26:59 k0H9jlky
紹介ありがとうございます。
後で少し、自分でも変換可否の欄追加しますね。

307:名無しさん@3周年
08/10/14 21:59:40 78JFQrHE
この辞書に理化学辞書のコンテンツカードつけるといろいろ制約あるみたいなんですけど
今後この辞書でも制約なく表示できるコンテンツカードが出る予定ってありますか?

308:名無しさん@3周年
08/10/14 23:38:24 sY0/W8UW
>>307
既に出ています。いっこだけ

309:名無しさん@3周年
08/10/15 19:50:27 /WfRKssL
これからの新モデルはユーザ辞書対応機が増えるから
このスレも大ブレイクするとおもおよ

310:名無しさん@3周年
08/10/16 15:01:29 JM5t12CD
SIIって電子辞書のPDFマニュアル公開してたっけ?
ちょっと探したけど見つけられなかった。

311:名無しさん@3周年
08/10/16 21:40:58 vCYvi7A/
>>310
無い。他のメーカーは有るのにねえ。

312:名無しさん@3周年
08/10/17 10:17:55 X9Xa+n4u
>>309
だといいなぁ。


313:名無しさん@3周年
08/10/17 21:53:30 7OcXqqwd
わーい辞書変換できました。
satier'sさん
wikiつくってくれた人ありがとう。wikiのとうりにやりました。
通信用語の基礎知識 (2004 年後期版)
URLリンク(openlab.ring.gr.jp)
変換した元の辞書データ wdic-fpw1.4.zip
一応MeCabも通しました。
SIIのツールで少しエラーがでるものの変換結果は良好と思います。

辞書内参照のリストが一部冗長になるのと
(「ー>ZSK」という同じ参照が複数行リストされる)
発音記号がおかしいのはsjisテキストのためと思います。
UTFで試してみます。
あと、追加辞書の部分で本体のスピードが遅くなりました。


314:名無しさん@3周年
08/10/17 22:01:14 7OcXqqwd
>>313 補足
辞書変換に使ったのは
00.txt
71.txt
91.txt
の3つです。

315:名無しさん@3周年
08/10/18 00:03:34 gM88fYBV
>>313
なかなかいいページがあるね。
ところで「とうり」→「とおり」

316:124
08/10/18 18:05:27 gSbHEPzN
>>313
発音記号がおかしいというのは、<A14A>
のようなものが混じっているということでしょうか?

これはepwing自体文字がJISで記録されていて、
JIS X 0208かJIS X 0201に含まれていない文字は外字として登録していて、
それは単純には対応するunicode文字に変換できないため、
コードのまま出力するようにしています。

正常に表示させるためには、
GAIJIをebdumpでテキスト形式にして、そのファイルを参照しながら、
tsvをエディタなどで一文字ずつ<A...>を対応するunicode文字に
置換し、utf-16で保存すればいいと思います。(すごく大変ですが…。

リストが冗長なのは後で直します。

あと、>>314は、たぶん00, 05, 91の間違いでは?

317:124
08/10/18 21:41:46 gSbHEPzN
参照IDが重複するtsvを直すスクリプトを書きました。
ruby uniqlink.rb < inputtsv.txt > outputtsv.txt
として実行できます。

318:313
08/10/19 10:10:21 FIIRmM2Q
>>316
>>317

素早い対応ありがとうございます。m(_ _)m

発音記号についてはその通りです。丁寧な解説で助かります。
表示がうまくできなくても問題ないのでこのままにします。


ID重複修正もかけてみたらなおっていました。ありがとうございました。

00.txt
71.txt
91.txt
ですが00と91以外はどれが良いかわからなくて適当に71を選びました。
05のほうがベターでしょうか?






319:124
08/10/19 11:01:44 jvsU51eM
71は後方一致INDEXで、自作辞書の機能に後方一致検索はないようなので、
71のファイルは入力してもepwing2tsvでは処理していない=無視しています。

確かその状態では00から見出し語を取っていますが、
05を付加すれば見出し語は05から読むようになります。

結果がまったく同じ場合もありますし、どちらが良いかは辞書によると思います。

320:名無しさん@3周年
08/10/19 11:23:26 7omeq17a
自作辞書ではワイルドカードが使えないってこと?

321:124
08/10/19 12:40:10 RHTmsR0Y
今試してみました。
ワイルドカードは使えます。

「*検索語」で後方一致検索ができるので、
>>319は間違いですね。

「自作辞書に後方一致INDEXのファイルは必要ない」に訂正します。

322:名無しさん@3周年
08/10/19 13:28:40 ZNqTMD/v
検証どうも。
ということはインデックスが無くてもワイルドカード検索は出来るのか。へー

323:名無しさん@3周年
08/10/19 13:30:16 ZNqTMD/v
ってワイルドカードの全てのパターンのインデックスを用意するわけないか…。アホなことを言ってしまった。

324:名無しさん@3周年
08/10/19 19:17:00 bo2NAcgw
wikiの変換に成功した人っていないですよね?

325:名無しさん@3周年
08/10/19 19:34:09 ifJL+ahx
ランダムハウスをepwing→900X用に変換した人います?

epwing化で諦めてる現状だけど、900Xで快適に使えるのならもうちょっと頑張ってみようかな


326:124
08/10/19 20:36:00 RHTmsR0Y
>>324
変換には成功しましたが、
辞書で検索が遅すぎて使えませんでした。

327:124
08/10/19 20:55:20 RHTmsR0Y
>>326はwikipediaの話です。。
wikipediaのことじゃなかったらすみません。

328:名無しさん@3周年
08/10/19 21:08:10 ZNqTMD/v
WikipediaをWikiと略すのは電子辞書を電子と略すようなものだな

329:324
08/10/19 23:46:10 bo2NAcgw
すいませんすいません
wikipediaのことです。
時間がかかりすぎですか・・・
何とか分割とか・・・して実用範囲まで持ってこれないものなんですかねぇ~?
僕はwikipediaをepwingにするところまではやったんですけど、その後が無理で・・・
普通にやったら辞書クリエイターで変換できます?
僕がやると、辞書クリエイターがクラッシュして、何度やってもだめでした。

CPU Core2Duo E6750
メモリ2GB
ってな環境です。

330:124
08/10/20 04:53:47 oZZYQa47
50万件のデータは一気にやるとクラッシュしました。
なので10万件で区切ってやりました。

最初の10万件だけでひとつの検索に約20秒ですから、
もっと分割して、1万件ごととかにするとどうなんでしょう…。
やってみないと分からないですね。

331:名無しさん@3周年
08/10/20 08:03:50 xZDxUpIK
ユーザ辞書作成補助スクリプトを作っています。
例えばテキスト形式で1行に1つの英単語のリストを入力すると
その対訳データをPDICのCSV形式ではき出します。
ベースになる辞書データはGENE95です。
流れはこうです。

0.GENE95をCSV形式で保存
1.単語リストをスクリプトに入力してCSVの対訳データを得る
2.->PDICでPDICテキスト形式に変換
3.->EBSutudioでepwingに変換
4.->epwing2tsvで変換
5->SIIの辞書データに変換

身近な単語リストとしてsvlがありますが、このページを保存したHTMLから
抜き出すモードも作りました。レベル2とレベル12を辞書化してみましたが
よさげです



332:名無しさん@3周年
08/10/20 08:19:06 xZDxUpIK
ところがPDIC自身にそういう機能があるみたいではずしてたみたいです。

333:名無しさん@3周年
08/10/20 08:24:03 xZDxUpIK
>>332
こんなのもあるみたい
apsse/Gapsse
URLリンク(www.forest.impress.co.jp)

334:名無しさん@3周年
08/10/20 08:34:44 xZDxUpIK
>>333

GappsseでSVL取得してみましたが超便利でした。
このツールは使える。


335:124
08/10/20 21:13:45 VSuD4IvO
>>329
朝wikipediaを1万件ごとに変換しようとしたら、最初の1万件でクラッシュして終わりました。
原因は調べてませんが、かなり前に変換したときとは別方法なので、何か書式エラーかと。
時間があるときにまた試してみようかなと思います。

>>331
やったことはないので不確かですが、
PDICテキストからtsvにはepwing介さなくてもたぶん簡単に変換できるのでは?
そのほうが情報のロスが少なくてよさそうな気がします。

336:名無しさん@3周年
08/10/21 08:15:00 VyRG4OtV
PDICからtsvならExcelのマクロでも出来るんちゃう

337:名無しさん@3周年
08/10/22 20:48:33 eHKUzO3b
豚切りで悪いけど、電子辞書にエディタが搭載されるきっかけになってほしい。
キーボードが好みなので、できればSIIで。

URLリンク(www.kingjim.co.jp)



338:名無しさん@3周年
08/10/22 21:17:19 8AJTJwms
>>337
同じこと考えた
合体して欲しい

339:名無しさん@3周年
08/10/22 21:19:06 yyHncwW3
337
>URLリンク(www.kingjim.co.jp)

絶対売れない気がする。


340:名無しさん@3周年
08/10/22 21:34:54 8AJTJwms
山根一眞さんが買う

341:名無しさん@3周年
08/10/22 22:35:21 HL719oW+
ポメラ、ちょっとニッチな感じだしね。
売れるかどうかというとちょっと...。

自作辞書利用可という意欲的なS9000の後継機にこそ、
簡易なものでよいのでエディタを搭載して欲しいよ。


342:名無しさん@3周年
08/10/23 10:51:42 UPnZLHQc
エディタなんていらねぇけど?


343:名無しさん@3周年
08/10/23 20:02:50 0kb/XUYY
大変便利なepwing2tsvスクリプトありがとうございます。
便利に使わせてもらっています。

epwing2tsvはEXEになっていて他のファイルはスクリプトのままなので
当然ですがルビーのインストールが必要です。

他のファイルもEXEにしてもらうとさらに敷居が低くなると思います。
MeCabのインストール先はルビーからレジストリを参照すれば取得できると思います。
EXE化されればこれらのファイルを呼び出す簡単なWindowsのGUIを作ろうと思っています。
(MeCabのフォルダ名をWindows側から渡すようにする形もあります)

いかがでしょうか




344:124
08/10/23 20:42:59 3F8XB8FS
>>343
土日の時間があるときにやります。
今のところスクリプトの引数でmecabのパスを渡そうと思っています。

345:名無しさん@3周年
08/10/25 18:32:30 RmTmLXRY
>>344
ということは、epwing3tsv.exeって
もともとはrubyスクリプトなんでしょうか。
もしそうなら、お暇なときに
MacやLinux環境のためにrubyのソースコードを公開していただければ幸いです。


#rubyは正規表現が使いやすいから便利ですねー

346:名無しさん@3周年
08/10/25 20:02:12 Oe+QBTQk
>>343
URLリンク(siidict.net)
にイメージ画像をアップしました。

347:名無しさん@3周年
08/10/25 22:27:30 +SAvKuZ9
来年大学に入学するので大学生協で購入しようと思ってるのですが
この英語に特化したタイプの辞書って毎年モデルチェンジしてるんですか?

348:名無しさん@3周年
08/10/25 23:23:28 NppTCMuQ
>>346
すごいですね。
これがあると、さらにユーザ辞書利用の敷居が低くなって、
作る人も増えそうですね

349:124
08/10/26 02:02:36 ySxD6agz
>>329
いまさらですが、>>335で1万件の変換でクラッシュしたのは、
単にひらがな化し忘れてただけでした。最初の1万件だけですが変換できました。
残りはまだやってません。

>>345
epwing2tsvはCで書きました。rubyは最近始めたばかりなのです。
ruby便利ですよねー、次修正するときは、rubyで書き直す"かも"です。

>>346
いい感じですねー、
明日?今日中にはexe化します。

350:名無しさん@3周年
08/10/26 10:11:49 3MenByCq
>>349
Cをruby化すると10倍くらい処理時間が落ちる感じです。
Cで1秒未満の処理ならいいですが数十秒だとするとつらいかもです。
実際に作ってみないとわかりませんが

351:124
08/10/26 11:36:21 ySxD6agz
>>350
確かに速度は遅いですよね、
1.91に少し期待です。

今からuniqlink.rbのexe版upします。
hiraka.rbはスクリプト変更しなきゃいけないのでまだです。

352:124
08/10/26 13:34:32 ySxD6agz
すべてexe化完了し、公開しました。

353:名無しさん@3周年
08/10/26 18:54:32 X3tf7N2T
>>349
ありがとうございます。そうでしたか。。
win機も利用しようと思えば利用できるので、そちらで試してみることにします。

354:343
08/10/26 23:17:29 ouWvhg52
>>352
早々の対応ありがとうございます。
Windowsのソフトはインストーラ形式にする予定でスクリプトのEXEファイルも
インストーラに内蔵してしまえばさらに楽にインストール可能になると思いますが
いかがでしょうか。
インストール後にスクリプトのEXEファイルを個別指定できますのでスクリプトの
最新版にあとから指定し直すことも可能です。

テストバージョンは今週末か来月上旬にどこかにアップします。



355:124
08/10/27 21:35:02 G5TFBGVw
>>354
インストーラに内蔵してもらって構いません。
公開が楽しみです。

356:名無しさん@3周年
08/10/27 22:20:55 bQ9eZkad
>>354
個人的なことですが、
インストーラ付パッケージと
zipの2種類用意した方が好きです。

357:343
08/10/27 22:33:37 bY/qHlnZ
>>355
快諾ありがとうございます。
インストーラのサイズは1Mバイトくらいになりそうです。
あと01.txtや91.txtの欄はひとまず4つしか用意していないですが
5つ以上の可能性はあるのでしょうか?


>>356
zipバージョンも用意します

358:343
08/10/27 22:42:15 bY/qHlnZ
>>356
zipバージョンなんですが、現状ではレジストリへの書き込みをする予定でインストーラの場合は
アンイストール時に自動的にレジストリを消去します。

zipの場合アンインストーラがないのでレジストリ消去用のEXEファイルを同梱しますが
実行し忘れればレジストリは残ってしまいます。




359:343
08/10/27 22:45:28 bY/qHlnZ
>>358
レジストリではなくiniファイル方式で考えてみます。

360:124
08/10/28 06:50:34 ehX/x9Wu
>>357
00,04,05,0A,90,91,81で最大7つになります。
…そんなに指定する人がいるかどうか分かりませんが…。

361:名無しさん@3周年
08/10/28 11:53:34 9Q6Gpxto
・SII SR-E6000
・SII SR-S9000
で悩んでいますが中3だとSII SR-E6000が無難ですか?
一応御三家中学なのでそれなりのレベルまでは勉強しているつもりです。
今日学校の帰りに買おうと思っています。

362:名無しさん@3周年
08/10/28 14:58:13 Hl1sSRHf
>>361
中学生なら学生向けモデルの方がいいんじゃないか…。
E6000は英語の類語辞典が無いのが痛い。
S9000は英語を「用意された教材」ではなく
英字新聞やラジオなどの「生の教材」で学習する段階で使うレベルの機種だ。
TOEICで言うと800ぐらい。
別にそのレベルに達する前に買ってもいいけど、多分無駄かな。
価格.comで安い型落ちの学生モデルを買うことをお勧めする。

363:名無しさん@3周年
08/10/28 19:35:06 keZStXXM
>>361
SIIは漢和の検索性は悪いし(部品検索や手書きがない)、
古語辞典がないから国語の学習には向いていない
御三家難とかがどのくらいの中学なのかは知らんが
中学生にSIIの英語モデルは勧めない

もう買ったかもしれないけど
こういうのはネットで買った方が遙かに安いから検索してみれ

364:名無しさん@3周年
08/10/28 19:47:16 bb1FwkxO
>>363
SIIのS9000使ってる。古語に関しては、追加の辞書で投入したから問題なし。
英語に関しては、そこらの辞書より優秀
参考書等は、基本的に本で買うのを勧める。

漢和は、あまり引くことがない(熟語として引けばすぐ出るので)
漢文でも、中高生は大概専用の文法書で問題ないはず。
教科書等に注釈あると思うしね。

S9000のメリットとしては、他人と違った百科事典と、(←一人だけ検索結果が出るなんてことも)
英語の膨大な量(英作で役立つかも。膨大すぎてほとんど生かせないだろう)
って感じかな。PCがそこそこ使えるなら、自作辞書入れてみるのもいいかも

周りと同じのがいいなら、シャープやカシオの方がいいとは思うけど。

365:名無しさん@3周年
08/10/28 19:58:20 keZStXXM
>>364
俺も使ってるんだが、古語のシルカってあったっけ?
どこで売ってるか教えてくれ。不便で困ってる。

366:名無しさん@3周年
08/10/28 20:49:32 YfT7gM1/
>>357
おおお!zip感謝です!

367:名無しさん@3周年
08/10/28 22:28:35 bb1FwkxO
>>365
epwing形式の辞書を買って、変換した。
S9000だったらできる。
詳しくは、URLリンク(siidict.net)

368:343
08/11/06 19:42:15 /mpyqlCF
windowsのソフトを作っている>>343です。

ようやく動作テストができるようになりました。
テスト版公開までもう少しかかる感じです。ダウンロードページは以下になります。
URLリンク(kuma.kanpaku.jp)

satierさん header.datは*.txtのあるフォルダにないとエラーになるみたいですが
可能であればepwing2tsv.exeのあるフォルダから参照するほうがいいのかなと思いました。
機会があればご検討をお願いします。

今回は*.txtフォルダにheader.datがない場合はコピーるすように対応しました。



369:124
08/11/06 21:59:18 pEf4Gbgo
>>368
今週の土日には修正します。
それまでお待ちください。。

370:343
08/11/06 22:17:51 B4AEsC2A
>>369

たびたびすいません。
ありがとうざいます。

371:124
08/11/09 23:09:45 meURis9h
>>370
修正の話ですが、
土日に予定がいろいろ入ってしまいできませんでした。
火曜の夜にできると思います。本当にすみません。。

372:名無しさん@3周年
08/11/10 18:23:43 yozd2n2u
124氏、343氏
ご両人のすばらしい能力とボランティア精神に敬意を表します

373:124
08/11/11 19:29:26 vhC7CYOm
>>370
header.datのパスはargv[0]から取得するように変更しました。
output.txtはこれまで通りカレントディレクトリ(作業フォルダ)に出力します。

374:343
08/11/11 20:38:22 3JdMiKih
>>373
お忙しいところありがとうございました。
順調にいけば今日、明日くらいにアップしたいと思います。


ところでZIP版を希望された方、ZIP版のメリットって何でしたっけ?


375:343
08/11/11 20:45:11 3JdMiKih
>> 374 追記

ZIP版ですが

1、インストーラの実行ファイルそのものをZIPで圧縮したもの。
2.インストーラなしの状態でZIP圧縮したもの。

と2種類あると思いますが

1、でもよいのか2、のほうが良いのでしょうか?



376:名無しさん@3周年
08/11/11 22:04:04 aE/VXDic
ふつーzip版といえばインストーラ無しだね
自動でどこかにファイルを置かれたりするのがいやな感じ

377:343
08/11/11 22:09:55 3JdMiKih
>>376

了解しました。



378:名無しさん@3周年
08/11/12 00:05:16 ZFgv7WPO
>>377
ZIP版をお願いしたものです。
>>376さんの言われている通りです。
余計な手間を取らせてすみません。

379:343
08/11/13 23:44:28 KZP0M8Q3
アップしました。
URLリンク(kuma.kanpaku.jp)

380:名無しさん@3周年
08/11/14 02:47:14 jfsWI3c2
>>379
ご苦労様です~
ZIP版感謝です。
ありがたく使わせていただきます。
これでPC初心者にも自作辞書が普及すればいいですね~

381:名無しさん@3周年
08/11/14 06:03:55 5N/bcdT9
>>379
ほえ~お疲れさんです。使いやすそう。

382:124
08/11/15 19:24:50 1w401K5r
お疲れ様です。
私も後で試してみますね。

383:343
08/11/15 20:06:42 3RB3NN4J
どうもです。
現在微妙に変更中です。
新規フォルダをドロップしたとき自動でファイル名をリストするように変更中です。
Ver.0.8.0の部分をVer.0.7.0にすれば実行ファイルは取得できます・

384:名無しさん@3周年
08/11/17 21:33:00 y04mUfhq
URLリンク(www.besta.com.hk)
欲しいんだが買えるとこ知ってる人おらんと?

385:名無しさん@3周年
08/11/18 20:29:09 8oZtErXR
>>384
ココとか
URLリンク(aycts.cart.fc2.com)

386:名無しさん@3周年
08/11/26 00:29:49 Zv69kCrn
自作辞書機能つきの新機種が発表されたのに、のびないな。
このスレではG9001の話題はだめかい?

387:名無しさん@3周年
08/11/26 08:58:02 CvVpvtfl
ここは自作辞書機能付きの機種のスレではなく自作辞書機能のスレです

388:305
08/11/26 23:38:31 UtyN3yIm
>>343さん
siidict管理です。
変換支援ソフトについて少しですが書いておきました。
何か加筆・訂正等ありましたらお願いします。

掲示板にパスをかけました。荒らしが酷すぎたので。
パスはURLリンク(siidict.net)に書いてますので、そちらでご確認ください。
11月初めから、サイト上に広告が出て見苦しいかとは思いますが、
私の金欠のため無料サーバーでの運用にご理解ください。
年に一度のドメインの更新だけはさせていただくつもりです。

389:名無しさん@3周年
08/12/17 23:34:22 kIHG+ag+
保守age

390:名無しさん@3周年
08/12/17 23:34:53 kIHG+ag+
保守age

391:名無しさん@3周年
08/12/23 00:52:26 KqPg0i/A
自作辞書の例文検索は結構時間かかるね
内蔵辞書の検索は早いから、
検索速度を早くできる作り方があるのかな


392:名無しさん@3周年
08/12/30 22:51:46 vbRV2qw+
URLリンク(sekky.tripod.com)
sekky先生も自作辞書を試したみたい。
上の書き込みはひょっとすると先生かも

393:名無しさん@3周年
09/01/07 13:41:45 t6MFcivD
wikipediaを40分割にして変換してみました。
検索に数十秒かかってしまうことも多い上に
何十件か見ているうちにフリーズすることも多いです。

数字を使った検索が不可能なのと、
読みがhirakaで入れたものなので適当な部分はありますが、
一応見ると言うことだけは何とかできるかな・・という状態です。

394:名無しさん@3周年
09/01/07 15:25:11 bACZUxeq
乙!

395:393
09/01/07 20:17:52 t6MFcivD
ただやたら固まる・・・
リセットを何度したことか・・
もうちょっと電子辞書のCPUがちゃんとしてればいいんですけどね・・
それと、SDを高速タイプに変えたとして、検索速度に関係ある?
今は上海問屋×transcendのmicroSD 2GB使ってるけど

hirakaの精度的な問題だろうけど、「白い巨塔」が「しろいきょとう」ではヒットしなくて、
「しろい」で下の方にヒットしてるとか色々と不便な点は多いな。

396:名無しさん@3周年
09/01/14 23:43:47 xYke1ebe
>>395
内蔵検索ソフトにバグあるよね
内蔵辞書しか使わなくても変な表示になることがある


397:393
09/01/15 22:15:22 MeH3eacu
履歴を押したら、変な英字と
Fixed the bug and update
的なことを行ってくるんだけど、どうしようもない・・・

昨日はwiki入れて検索してたら、フリーズして、いつもだったらリセットで直るんだけど、
直らなくて、電池抜いたりカード抜いたりしたけどだめで、修理に出そうと思ってたら、
今日付けてみてたら正常に動作したり・・・

画面を高精細にしたから、ちょっとCPUとかが無理してる感じが否めない

398:名無しさん@3周年
09/01/21 23:02:37 Sk9jikG6
S9000はSL900Xに圧倒的に負けてるね

値段でも収録コンテンツでも

ははは、9000買ってしまった奴は糞だなあwww

399:名無しさん@3周年
09/01/22 07:29:41 qVw5Fter
それほどの差はないような

400:名無しさん@3周年
09/01/22 11:59:04 re1CKZWo
もういいって…マイペディアひとつでも大きな差なのに、広辞苑とか全然ちがうよ

401:名無しさん@3周年
09/01/22 15:37:25 2unAcEIS
>>400
英語モデルなのに英語以外を重視というわけですね。

402:名無しさん@3周年
09/01/22 23:30:35 Vbndagza
マイペディアが無いのは残念だけど、類語はほぼ使わないしなー。
カタカナ語はたまーに地味に役立つけど。
でも、広辞苑よりはまだ大辞泉の方がずっとまし。大辞林だともっといいけど。
広辞苑がいいと言ってる人達って引き比べたことあるのか、と思ってしまう。

403:名無しさん@3周年
09/01/23 01:27:37 xzzdiEw9
でも、6版になってだいぶましになったよ。

404:名無しさん@3周年
09/01/23 20:46:30 TeeDo86+
広辞苑がとにかくいいって人はどうなんだか・・
確かに「広辞苑より」て書けば箔は付くだろうけど、
意味の定義の仕方が古語的な感じで大辞泉とかのほうがわかりやすかったりする
大辞泉が格別イイとも思わないけど・・

俺は発売当初に買ったけど
値段はどちらもほぼ同じかS9000の方が安く(通販使えば)
広辞苑が嫌いだからS9000買った。

マイペディアってホントに必要か?
ブリタニカでかなりカバーできるし、欲しい人は
自作辞書でwikipediaでも入れれば検索速度は落ちるけど、
情報量は圧倒的だ。

405:名無しさん@3周年
09/01/23 20:53:10 xzzdiEw9
生物系が弱いのが難点。

406:名無しさん@3周年
09/01/24 03:12:12 HXtSIr3y
言葉の意味が知りたいだけなら広辞苑じゃないほうがいいんだが、
広辞苑は引用するときに便利だからはずせないだよ。

そんなことより、おまえら・・・

■ おすすめ2ちゃんねる 開発中。。。 by FOX ★
このスレを見ている人はこんなスレも見ています。(ver 0.20)
若い頃落合信彦の本にハマってた人 [30代]

407:名無しさん@3周年
09/01/27 21:16:52 XDDd6DF0
内容、操作性、共に文句なしだね。
ただ、バックライト欲しい。
うちの部屋は思った以上に暗かったようだ。。
正直見づらい。

408:名無しさん@3周年
09/01/27 21:21:49 j28a8NhJ
デスク用のライト買うと良いよ。 昔ながらのアームの奴でいいじゃん
2000円ぐらいで買える。 OHMの安い電球型蛍光灯付ければコスパ良いよ。

409:名無しさん@3周年
09/01/29 23:30:45 TylURil1
結局検索の優秀さはセイコーなんかな?

410:名無しさん@3周年
09/01/30 18:43:32 bvCMdSDe
今日S9000買ってきた
ヨドバシで31900円のポイント20%だから生協で買うよりお得かな
901の発売まで待てなかったよ・・・

411:名無しさん@3周年
09/01/30 19:06:11 2k0MXY7B
あほだな

412:名無しさん@3周年
09/01/31 00:06:42 7cUIMowe
>>410
微妙なタイミングで買ったなw
まあ、この手の商品は欲しいときに買えばいいよ

413:名無しさん@3周年
09/01/31 00:52:33 7cUIMowe
>>404
広辞苑は一つのブランド

「辞書」

広辞苑:ことばや漢字を集め、一定の順序に並べ、その読み方・
意味・語源・用例などを解説した書。辞典。辞彙。「―を引く」
「英和対訳袖珍―」
大辞林:多くの言葉や文字を一定の基準によって配列し、
その表記法・発音・語源・意味・用法などを記した書物。国語辞書・
漢和辞書・外国語辞書・百科辞書のほか、
ある分野の語を集めた特殊辞書、
ある専門分野の語を集めた専門辞書などの種類がある。辞典。
辞彙(じい)。語彙。字書。字引。
大辞泉:多数の語を集録し、
一定の順序に配列して一つの集合体として、個々の語の意味・用法、
またはその示す内容について記したもの。語のほかに接辞や連語・
諺なども収める。また、語の表記単位である文字、
特に漢字を登録したものも含めていう。辞書は辞典(ことばてん)・
事典(ことてん)・字典(もじてん)に分類されるが、
現実に刊行されている辞書の書名では、
これらが明確に使い分けられているとはいえない。辞典。字書。
字引(じびき)。

日国大:ことばや文字をある観点から整理して排列し、その読み方、
意味などを記した書物。外国語辞書・漢和辞書・
国語辞書などを含めていう。国語辞書の中には、普通のもの以外に、
百科辞書や地名辞書・人名辞書、また、時代・ジャンル・
作品などを限ったもの、各学問分野別に専門用語を中心に集めたもの、
方言・隠語・外来語など語の性質別にまとめたもの、
表現表記に関するものなど、内容上多くの種類がある。辞典。字引。
字書。字典。※以下、用例を省略

414:名無しさん@3周年
09/01/31 00:53:01 7cUIMowe
これだけを見れば、大辞泉が大健闘しているとわかる

ただし、広辞苑には
>ことばを書きつらねたもの。文章。蘭学事始「蘭学は実事を―にそのまま記せし者」
>〔言〕ある言語の語彙のすべてについて、一般的規則では扱えない音韻・統語・形態・意味上の性質を記述した文法モデルの一部門。レキシコン。
まで出ているが、上のは日国大だけ、下のは広辞苑にしか出ていない
大辞泉は類語の一つとしてレキシコンを挙げているが、大辞林はなし

何か一冊というなら自分の好きな国語辞典が収録されているモデルを
選べばいいと思う

しかし、こうやって引き比べられる環境を構築できるのもいい
俺は日国大、国語大、広辞苑(旧)、大辞林、大辞泉、言泉(紙)、
日本語大辞典(紙)、その他、いくつかの小型辞典を所有している
だが、俺はまだ広辞苑の最新版にアクセスできないでいる
だから、俺は広辞苑の最新版が収録されたモデルが欲しい

マイペディアは「主役」じゃない あくまでも「脇役」
だから、百科をそれほど必要としないやつにとっては
重視するポイントじゃないだろうな

415:名無しさん@3周年
09/01/31 01:08:50 i6lknj+I
広辞苑、マイペディア、とブリタニカあれば最高の愛

416:名無しさん@3周年
09/01/31 01:13:04 7cUIMowe
>>409
使い手を選ぶかもね、優秀=高機能ということだから
俺のイメージだと、SIIは「英語の用例検索が優秀」って感じ
そこを重視するなら、SIIだろう
というか、ここはSIIスレだから、それ以外の選択肢はないなw

417:名無しさん@3周年
09/02/19 21:43:55 L3bFDXkK
901X age

418:名無しさん@3周年
09/02/19 23:55:42 e1vopBjl
901内蔵メモリ減ってる・・・
安くなってるのに、妙なところで仕様変更してる
百科事典が一つ減ったのも残念

プラス面では、
辞書データが容量増えてるのあるみたい
英検・資格試験用が充実
新機能の使い勝手どうなのか気になる


419:名無しさん@3周年
09/02/24 08:52:24 smTzqO5J
あげ

420:名無しさん@3周年
09/02/24 19:05:52 VZjLaTpR
まげ

421:名無しさん@3周年
09/02/25 11:04:03 9wYFZNa1
最近SR-G6000M を買った者です。
セイコーさんのは検索速いし使いやすいのですが
シルカカードとSDは互換性ないのでしょうか?
フォーマットなどハックしてる人が居れば
このスレの自作辞書が入れれて便利だろうなぁ・・・
と思っていますが何かご存じの方おられます?

422:名無しさん@3周年
09/02/25 13:28:47 3OlzVLYp
ない

423:名無しさん@3周年
09/02/27 17:41:48 VcX4bX2b
いない

424:名無しさん@3周年
09/03/01 11:15:30 jvou3CyE
最近SL900xを買いました。
ウィキペディアを自作辞書にしたいのですが、
HONMON.ebzをどうしたらいいのでしょう?
こちらで紹介されているepwing2tsv支援ツール
でtsv化することはできますか?
初心者で申し訳ありません。

425:名無しさん@3周年
09/03/01 20:13:41 7juuul6p
>>424
できます。私が運営していた、やり方を詳しく説明しているサイトが
あったのですが、レンタルしていたxreaのs353サーバが故障し、
現在は見ることができません。バックアップを取っていなかったので、
復旧は未定です。手順を簡単に説明すると、
ebdump URLリンク(www31.ocn.ne.jp)
を使って、URLリンク(72.14.235.132)
のように4.まで行う。

URLリンク(kuma.kanpaku.jp)
から支援ソフトをDLし、さっきまで作ってたファイルをドラッグアンドドロップ
後は適当に実行するのみ。

426:名無しさん@3周年
09/03/01 20:32:15 7juuul6p
補足します。
私もwikipediaを変換しましたが、
変換、使用には難があります。
1:検索に数十秒かかり、暇つぶしに見る用途以外では使い物にならない
2:フリーズを起こすこともある
3:wikipediaのファイルサイズが大きすぎるため、
分割しないと作成できない(?)。よって結構めんどくさい。

427:名無しさん@3周年
09/03/01 21:22:27 2Xs+m5hS
wikipediaはどんどん増えていくからなあ

428:名無しさん@3周年
09/03/01 21:32:26 QI4HOZO5
これって分割すれば検索スピード上がるんだよね
かなり細かく分割すればいいんじゃないの?

429:名無しさん@3周年
09/03/01 21:37:05 7juuul6p
とりあえずsiidict.net復旧させましたが、記事は無いので
書いていただける方がいらっしゃいましたらお願いします。

googleに残っていたキャッシュ
URLリンク(www.google.co.jp)

430:名無しさん@3周年
09/03/01 21:45:28 7juuul6p
>>428
たぶん早くならないと思います・・
サイズ的に変換できないから分割してるだけで、
分割すればするほど変換がめんどくさいだけに思います。
あくまで自分が使って感じたことで、計測したわけではないですが。

431:Sekky ◆v3por7EIIw
09/03/02 17:27:06 Y4hr34nv
>>428

日本大百科全書のEPWING版を変換してみましたが,細かく分割しても目に見えて速くなることはありません。
一括検索の際などは,結局分割した全部を検索するので,日本大百科全書のところへ来るとスクロールが
フリーズしたようになりますし,個別検索でやろうとすると,細かく分ければ分けるほど,(紙の百科事典と同じで)
検索するものを選ぶのが面倒になります。

100数十MBの日本大百科全書でそうですから,Wikipediaは実用に耐えるかどうか(それ以前に,変換作業が
うまく行くかどうか)不安です。iPhoneの(英語版)Wikipediaをローカルに落として検索できるソフトは快適ですので,
これが日本語版Wikipediaに対応するのを期待したほうがいいのかもしれません。

432:名無しさん@3周年
09/03/03 00:02:30 KKMKvpoy
>>425さん、>>428さん、>>431Sekkyさん

みなさま、初心者の疑問にやさしく答えてくださってありがとうございます。
いま、ebdumpを使っているところですが、古いPCだからかもしれませんが、
かなり時間がかかっています。

ところで、Wikipediaのebzファイルは800mbを軽く超えてます。
やはり、実用にはかなり無理があるかもしれませんね。
ブリタニカ、マイペディアに加えて、時事にも強いウィキペディアが
入れられれば、自分的には最高だと思ったのですが…
ほかにも入れたい用語辞典や技術的なデータがあるので、地道に手作りしてみます。
英語学習というより、仕事や学校(社会人院生です)で使うポケットデータベース
の構築が目標です。


433:名無しさん@3周年
09/03/03 01:14:35 Wpb8/CeE
Wikipediaを持ち歩きたいなら、smarphoneの方が良いんじゃないかな。

434:名無しさん@3周年
09/03/10 23:21:03 S4xI7Kwy
自作の辞書を作ろうと思ったんだが、画像の4bitグレースケールってどうやって変換すれば良いんだ?
どの画像編集ソフトも8bitにしか対応して無くて、4bitにすることができない。
なんかいいソフトあったら教えておくれ。

435:名無しさん@3周年
09/03/11 03:06:24 sKWwe+Ub
IrfanViewでいいかと

436:名無しさん@3周年
09/03/11 03:26:33 sKWwe+Ub
ていうか一発で4bitグレースケールにしようと思ってるの?
グレースケールは8bitが当たり前
グレースケールにしてから16色に減色するんだよ

437:名無しさん@3周年
09/04/03 10:46:54 dI9lFn4n
ところでニコ厨的な発言で申し訳ないんだが
ニコニコ大百科は辞書変換可能ですか?
URLリンク(dic.nicovideo.jp)
記事は4万件程度でなかなか良い暇つぶしには最適かと


438:名無しさん@3周年
09/04/22 20:58:40 ru7lps68
シルカカード買ってみた
端子が4つ多い

データ構造調べるのは無理みたいだね

439:名無しさん@3周年
09/04/29 21:23:35 y9+dfbVd
>>437
データが決まったフォーマットで公開されているなら可能。
wikipediaは全ページのデータがダウンロードできるが、
ニコニコ大百科ではたぶんそういうのはないと思われ

440:名無しさん@3周年
09/05/19 22:22:29 OZ15XOK6
wiki丸ごと入ったら最強の辞書になるなぁ。
単語帳みたいなのを作成したいけど、わざわざExcelで作って変換してってのが面倒くさくて
結局ノートに書いてて自作機能をまったく使ってない・・・。


441:名無しさん@3周年
09/05/19 22:57:13 oO6uDeLz
Wikipediaを入れることができるならやり方が詳しく乗っているサイトってありますか?
あったら教えてほしいです

442:名無しさん@3周年
09/05/20 18:05:48 63Tb99pV
>>439

抽出するプログラムでも書いてみるしかないか…

443:名無しさん@3周年
09/05/27 21:22:45 IwIvU9w6
誰かwikiのバックアップとか持ってない?
epwingのえいじろうのサンプルためしに入れてみたいんだけどわからなかった…

444:名無しさん@3周年
09/06/04 00:06:24 Y9QIM4hi
wikiをオフラインで使いたいなら、こっちの方がいいような気がする。
URLリンク(bitli.blog36.fc2.com)

445:名無しさん@3周年
09/06/22 01:16:03 TGss7pKO
自作ドリル作ってみた
法律の短答問題集をOCR使って元データにし、
これを変換したら、エラー無くあっさり完成してしまった

自作辞書よりずっと楽だね
ドリルの使い勝手もなかなかいい

446:名無しさん@3周年
09/06/24 01:46:23 YRbeEc90
自作ドリルすごく便利
日本語OCRの精度がいまいちなのが残念だけど

日本語OCRって、10年前から大して精度上がってないね

447:名無しさん@3周年
09/06/24 18:19:37 EGyKf18/
(´ι_` )あっそ

448:名無しさん@Linuxザウルス
09/07/13 08:12:00 87eIv9Xw
こんなところに
あっそう総理が

449:名無しさん@3周年
09/08/11 04:12:15 QTJ3Of6R
SDカードを高速の物にしたら、
自作辞書の検索速度アップするのかな
内蔵辞書に比べてかなり遅いよね

450:名無しさん@3周年
09/08/15 18:40:47 FDHyrpcs
自作辞書って、ハングルも対応してるの?

同時進行で勉強してるので、出来ればひとつにまとめたい。
ハングル辞書はヌリアンを使用してるのだけど。

451:名無しさん@3周年
09/09/13 00:50:46 UvU/GRhW
epwing2tsvの作者の人、まだこのスレ見てくれてるかなぁ。

epwing2tsv(002d)で、wikipediaのdumpファイル(00.txt,91.txt)を変換をすると、
body.tmpとtitl.tmpが出来るのだけど、
その後エラーが出て、output.txtが出来ません。

body.tmpのサイズは1.51G
titl.tmpのサイズは12.4M
です。

we2tを使用しても同じような結果です。

この二つの出力ファイル(body.tmp,titl.tmp)から、
output.txtを作成するにはどうしたらいいでしょうか。


452:名無しさん@3周年
09/09/13 01:24:47 UvU/GRhW
ちなみに、
00.txtのサイズは3.02G
91.txtのサイズは1.06M
です。

変換元のwikipedia(epwing化したもの)は、
下のサイトで配布している、8/31分(最新版)のです。
URLリンク(www.border.jp)

453:名無しさん@3周年
09/09/13 11:43:35 UvU/GRhW
EBdumpを最新版(ver 1.28)に変えたら、
正常にepwing2tsvを使えました。

お騒がせして、申し訳ありませんでした。


454:名無しさん@3周年
09/09/16 00:03:25 bdOpRbpt
例文は辞書容量を激増させるみたい

例文ばかりの辞書で、
試しに例文を本文のところにまとめてみたら、
容量が1/3になった


455:名無しさん@3周年
09/09/20 11:56:09 NkhB1SFK
自作辞書の本文に<p>とかの表記をしたい場合、
どうすれば可能ですか?

辞書作成ツールのタグと同じなので、
エラーになってしまいます。

456:名無しさん@3周年
09/09/20 17:01:32 NkhB1SFK
動作速度がちょっと遅めだけど、
何とか実用的な範囲内の速度で使えるwikipediaを作れそう


457:名無しさん@3周年
09/09/20 22:36:57 NkhB1SFK
1つの言葉調べるのに、数秒って感じ

他辞書などの文中語句からジャンプで探すと、
15~20秒程度


458:名無しさん@3周年
09/09/21 06:23:28 WJKs53/b
ストレス有りすぎじゃないかい?

459:名無しさん@3周年
09/09/21 17:01:35 pP/gs6Ps
>>458
自作辞書使うと、
例文検索でも数十秒かかること多い
(数十万例程度の例文辞書で)

自作例文辞書を普段使っているけど、
慣れてしまえば、このくらいは大丈夫だよ
なんといっても、電車の中とか、どこでも使えるのが大きい

itouch使ってepwingでもいいけどね
これなんか、辞書として使っても、すごく便利そう
URLリンク(jp.kohjinsha.com)
店頭で実物使ってみたけど、SIIの電子辞書に似てた


460:名無しさん@3周年
09/09/21 18:08:30 WJKs53/b
epwingなら、zaurusのほうがよくない?

461:名無しさん@3周年
09/09/22 00:52:07 agF5MNRM
wikipediaの読み仮名って、
変なものもかなり混じってるね


462:名無しさん@3周年
09/09/22 15:59:01 agF5MNRM
辞書のファイル名でエラーでたりする。
ファイルの中身は全く同じでも、
名前を変えるだけで正常動作したり、エラーになったり。


463:名無しさん@3周年
09/09/23 06:26:13 5/JJTvPH
使ってて気づいた辞書作成ツールの制約
1コアしか使えない
複数ユーザーが同時にツールを実行できない(C:\TempUsrを共有しているから?)


464:名無しさん@3周年
09/09/25 01:24:05 Zzn5Hgkl
wikipediaの読み仮名は、
最初から作り直した方が良いんじゃないかと思えてきた
あまりにも変なのが混じりすぎ

英語版はどうなっているのだろうか


465:名無しさん@3周年
09/09/26 23:31:55 /+qM3mpl
だんだん良い感じになってきた


466:名無しさん@3周年
09/09/27 13:47:21 Lu8io03J
hirakaかMeCabか、どっちの影響か分からないけど、
無量大数やダイヤル数のように、
読み仮名に大量の数字の羅列が含まれていると、
それ以降エラーになってしまう


467:名無しさん@3周年
09/09/27 16:01:13 Lu8io03J
epwing2tsv作成データで、
一部読みが変なところに入っているみたい

例えば、「著作権の保護期間」の読みが、
「エジプト」の項目の読みに紛れ込んで、
(ダンプデータで直前の項目?)
著作権の保護期間の読みが無くなっている


468:名無しさん@3周年
09/09/27 23:21:07 Lu8io03J
辞書の分割数を増やしても、
ジャンプ検索する速度は大して変化しないみたい


469:名無しさん@3周年
09/09/29 13:16:56 6bnCixMx
9/27版ペースにして変換できた
まだ一部エラーがあるけど


470:名無しさん@3周年
09/09/30 17:28:40 q4tiU6/i
epwing2tsvの本文分割機能(4000字制限に対応するもの?)にバグがある?
分割が上手くいっていないのを時々見かける

例えば、2009/9/27版wikipedia(epwing版)を使って変換してみると、
「二松學舍大学」の項目は、本文が一部抜けてしまう


471:名無しさん@3周年
09/10/02 13:38:05 1LCzl/m/
UTF8対応版EPWING化Wikipediaがあるのか
これ使えば文字化け少なくなるかな


472:名無しさん@3周年
09/10/29 11:32:40 K8SIi/xV



岡田外務大臣キタ━━━(゚∀゚)━━━ !!!!!
h‍ttp‍:‍/‍/‍q‍b5.2‍ch.net/t‍est/rea‍d.cgi‍/sak‍u2ch/1256‍630318/1



早く記念カキコしないと埋まっちゃうwww


473:名無しさん@3周年
09/12/19 19:00:40 Qwe6lvBk
今頃SR-G10000の方を買おうとしてる俺がいる

474:名無しさん@3周年
09/12/19 19:40:10 0Vjy6O/M
>>473
G10000では自作辞書は使えない

475:名無しさん@3周年
09/12/29 07:39:04 avKtBcuV
SR-G7001Mを購入した俺が通りますよ。

476:名無しさん@3周年
09/12/30 16:12:06 GuzLZXR3
現ナマやああああああああああああああああああああああ

と歓ぶとでも思うか
撮影用の小道具やろが

477:名無しさん@3周年
10/01/12 23:40:05 QCQ75mJY
2010年度版生協モデルって、これがベースになるのかな
URLリンク(pc.watch.impress.co.jp)


478:名無しさん@3周年
10/01/13 16:17:08 rZWi4Yvo
9002ベースみたいだね
ジーニアス(G4or大辞典)がないのは残念

それにしても、
ランダムハウスみたいな古い辞書をメインに据えた意図がよく分からない
英語系教員の意見を重視したのかな
全学部向けの生協モデルには不向きな気がする

479:名無しさん@3周年
10/01/13 23:41:40 TV1h/L1V
SII電子辞書用wikipedia作ってみました
URLリンク(cid-5c09af0e4358cc4b.skydrive.live.com)

とりあえず使えれば十分(無いよりはまし)という人向けです

part1~part16をダウンロードし、winrarで結合・解凍して出来たファイルを、
1G以上のSDカードにコピーすれば、
SIIの自作辞書使用可能機種で使えると思います
(動作確認:SL900X)

480:名無しさん@3周年
10/01/14 10:51:19 /47VtcwY
㌧!
解凍後どうすればいいのか教えてくん。

481:名無しさん@3周年
10/01/14 16:55:39 rmohdaa1
>>479
SR-G7001Mで動いた! すばらしい。
しかも、遅いながらも実用的な速度。

でも、一括検索が重くなる。
「一括検索」の検索対象から自作辞書をはずす方法ない?

>>480
part1~part16をおんなじディレクトリに入れ、
winrarをインストールして、part1を解凍させる。→全部が解凍される。
SDカードをさした電子辞書をPCにつないで、
解凍したusrファイル全部を、「リムーバルディスク」にコピー。

482:名無しさん@3周年
10/01/14 18:27:48 P3Nc4809
ありがてえ。
明日退院だから、まだあげておいてほしいっす。

483:名無しさん@3周年
10/01/14 18:53:11 /47VtcwY
>>481
㌧!!家に帰ったらやってみます。

484:名無しさん@3周年
10/01/15 18:18:44 wWvvspkD
>>479
あれ、出遅れたかな? DLできない・・・

485:名無しさん@3周年
10/01/15 18:34:31 YMKyoITp
>>484
chrome使ってない? IEだと落ちるよ。
1つのファイルのDL中でも他のファイルもDLできるよ。

486:484
10/01/15 19:27:33 wWvvspkD
>>485
レスありがとう。
ブラウザを変えたらDLできました。

>>479
DLさせていただきました。
ありがたく使わせていただきます! 感謝!!

487:名無しさん@3周年
10/01/15 21:53:28 dpLtC/c5
IE6でDLできなくてFirefox3.0.5でもDLできなかったけど、Firefox3.0.17にしたらDLできたわサンクス
ちなみに結合・解凍はALZipっての使ってる

488:名無しさん@3周年
10/01/15 23:19:03 mlibcRiO
式が出ないのね…
対応してくれないかな>SIIさん

489:名無しさん@3周年
10/01/16 07:49:20 BGi1dWnu
>>485
おれもDLできました。ありがとう。

490:名無しさん@3周年
10/01/16 11:57:40 VZi5XMSi
>>479
SkyDriveからのDLに多少難儀したが、
>>481と同じくSR-G7001Mで動作した。多謝!
検索速度は多少モッサリだが、十分実用範囲内。
作成手順and/orプログラムは公開しないの?

491:名無しさん@3周年
10/01/23 12:29:40 9+ZIWIVJ
式は(私は)そんなに必要性を感じないが、
表は欲しいなぁ。
いろいろまとまっていてパッと分かるから。


あと、>>479
スペースが妙なところに挿入されているような気がする。
例えば『電子辞書』を検索したときに、

(前略)
■規格
いわゆる電子辞書のフォーマットにはいくつかの規格がある。
(全角スペース?)電子ブック
EPWING
BAS
(全角スペース?)など。


492:名無しさん@3周年
10/01/28 01:24:55 SDjkhdbi
自作辞書にutf8で保存されたテキストファイルが使えるようなことがガイドに書いてあるんだけど、
実際に使えた人いますか?
自分の環境では、エラーになってしまいます。

使用環境 XP(pro) SP3

493:名無しさん@3周年
10/01/28 02:27:37 elI+M9tD
>>479
ダウンロードしました。ありがとうございます。
ついでに英語版Wikipediaも作っていただけないかな…なんて。

494:名無しさん@3周年
10/01/28 23:14:34 SDjkhdbi
>>492の件は自己解決しました
OpenOfficeでunicode保存したら使えました

そのファイルを秀丸で読み込むと、
utf8表示になるけど、
秀丸でsjisからutf8に変換したものとは、
何かが違うのかも

文字コードのことはよく分からない・・・

495:名無しさん@3周年
10/01/30 22:00:29 mVFdeQXV
>>493
英語版もほしいね。

どこかに作り方が書いてあれば誰かが作ってくれるかもね

496:名無しさん@3周年
10/01/30 23:48:32 7ZaIB65m
>>495
英語版はデータが大きすぎて、
2GのSDカードに入りきらないから無理だと思う
(非圧縮のepwing版辞書サイズが20G近くある)
SIIの辞書でSDHCカードが使えるようになれば可能かもしれないけど

497:名無しさん@3周年
10/01/31 09:09:37 z+B7sPyV
>>496
そうなんだ。残念。

ジャンル別に生成して好きなの選ぶとかできるといいかも。


498:名無しさん@3周年
10/01/31 14:05:07 Pb7bpqYC
>>494
これは、BOM有無がかかわってそう


499:名無しさん@3周年
10/02/01 22:43:20 veyycx7a
規制が解除されたのでここに書きます

wikipedia日本語版(2010/01/30版)作りました
URLリンク(cid-5c09af0e4358cc4b.skydrive.live.com)
ファイルは全部で14(part1~part14)です


500:名無しさん@3周年
10/02/01 23:04:08 xsXUkN2Q
>>499
ファイルを置いてくれるのは大変ありがたいんだが、
作り方の詳細を教えてくれまいか?

501:名無しさん@3周年
10/02/01 23:09:57 QQziE4k7
>>481当たりを読め

502:名無しさん@3周年
10/02/01 23:16:11 xsXUkN2Q
>>501
いや、そっちの作り方(使い方)じゃなくて、
>>449のファイル自体の作り方を知りたいんだYO!
分かりにくくてスマソ。

503:名無しさん@3周年
10/02/01 23:31:52 veyycx7a
>>500
1. wikipediaのソースをダウンロードします
(URLリンク(download.wikimedia.org))

2. wikipedia-fpwでepwing化します
(URLリンク(green.ribbon.to))

3. epwing化された辞書をEBdumpでテキストダンプします
(URLリンク(www31.ocn.ne.jp))

4. ダンプデータをepwing2tsvで加工します
(URLリンク(ameblo.jp))

そこからは自作プログラムとひらがな化スクリプトを組み合わせて、
色々やってます

ひらがな化スクリプト
(URLリンク(ameblo.jp))

wikipediaは機械的に処理してもエラーになる部分が多く、
また、そのままでは動作速度が実用的にならないので、
試行錯誤の部分が多いです


504:名無しさん@3周年
10/02/01 23:33:44 veyycx7a
リンクの最後にカッコが含まれてしまってますが、
カッコはいらないです


505:名無しさん@3周年
10/02/02 06:29:46 5K7HkcV7
>>503
その『自作プログラム』も公開してくれまいか?

506:名無しさん@3周年
10/02/02 22:14:28 8hBO4yhY
英辞郎は変換できるの?

507:名無しさん@3周年
10/02/04 06:16:36 p0GAJHmO
やってどうするの?

508:名無しさん@3周年
10/02/20 01:16:42 Xj7XKO08
494を書いた本人ですが、
SIIの自作辞書ツールは、
本当にunicodeを扱えるのでしょうか?
書き込んだ後、変換できたと思ったのは勘違いだと分かりました

元々utf8のファイル 変換不可能
utf8からsjisに形式変換したファイル 変換可能
変換可能だったsjisファイルをもう一度utf8に形式変換したファイル 変換不可能

自分のところでは、BOMの有無・改行コードの種類にかかわらず、
utf8のファイルは変換できていません


509:名無しさん@3周年
10/02/20 15:49:49 aF35XmZ+
扱えるのはUTF-16なんじゃない?

510:名無しさん@3周年
10/02/23 17:04:37 iV+w7Ip0
>>506です。
がんばればできそうだね。
エクセル以外で変換できるソフトないですか?
エクセルだと一度に開ける単語数(行の数)が少なすぎる。

>>507
いえ、英辞郎の方が理系の登録単語数が多いんで助かるもんで…

511:名無しさん@3周年
10/03/03 21:27:48 878kOEkK
Wikipedia2010/2/26版の試験版をアップロードしました。
前回の試験版(2/17版)よりはバグが少なくなくなっていると思います。
(まだまだ変なところはたくさんあるけど)
URLリンク(cid-5c09af0e4358cc4b.skydrive.live.com)

512:名無しさん@3周年
10/03/08 22:01:46 QLhon6oF
いつもの場所に、
Wikipedia日本語版(20100306)をアップロードしました。

今回は、数式を画像化してみました。


513:名無しさん@3周年
10/03/09 01:10:44 v80b3mls
いっちゅもいっちゅも乙!

514:名無しさん@3周年
10/03/10 20:58:13 DzJhucCI
>>512
すげぇ。乙です。

515:名無しさん@3周年
10/03/21 12:47:43 M/lSirsU
いつもの場所に、
Wikipedia日本語版20100317版をアップロードしました。


516:名無しさん@3周年
10/03/21 21:27:48 N7KY2Hrh
★★★
URLリンク(www.wakeari-sirorom.com)


517:名無しさん@3周年
10/03/22 13:56:01 3t/3iIeL


518:名無しさん@3周年
10/04/03 13:27:43 CaH4puff
Wikipediaフランス語版(2010/04/01版)のSII電子辞書用自作辞書を、
試験的に作ってみました。
アップロード場所はいつものところです。
URLリンク(cid-5c09af0e4358cc4b.skydrive.live.com)

従来の変換スクリプトを多少手直しするだけで、
アルファベット圏のものなら作れそうな気がしたので、
試してみました。
ただ、自分はフランス語が全く分からないため、
動作チェックを全くしていません。


519:名無しさん@3周年
10/04/03 13:29:56 CaH4puff
分割ファイルは、01~17の、全17ファイルです。
WinRar等を用いて解凍して下さい。


520:名無しさん@3周年
10/04/03 13:55:53 qu2YNTht
いつもいただいております。ありがとうございます。

521:ろいろん
10/04/04 02:11:10 Pih/LUwD
ここ三日ほどロイヤル英文法とlongman activatorをepwingにして、テキストダンプにして、epwing2tsv支援ソフトで変換して、…ってやってきたのだが、前者は辞書クリエーターが延々変換中になって止まらない。後者は辞書できたが余計な記号がタクサン混入している。

なんかうまくいかない。この二つの辞書があれば俺的には完璧なのに

522:名無しさん@3周年
10/04/11 09:06:23 FF7Pr28l
>>515
便利に使わせていただいております。ありがとうございます。幅広く検索できるようになって嬉しいです。
ただ、一時的にでも一括検索の対象から外したりすることができれば、という願いもあります。
シルカカードを検索対象から外すことは可能なのですが、こんな風にできるには、メーカーの
ファームアップぐらいしか期待できないのでしょうか。

523:名無しさん@3周年
10/04/12 01:58:07 oN3PkLO5
英辞郎をなんとかユーザー辞書に変換しようと試みたけれど
色々試したが、クリエーターが変換中のまま、動作停止状態に・・・

英辞郎持ち歩ければ最高なんだけど
変換して持ち歩いている人いる?



524:名無しさん@3周年
10/04/12 05:04:03 WNDwn5LA
>>523
ファイルを3分割にして
実行したらうまくいった。
試してみて。


525:名無しさん@3周年
10/04/12 22:35:59 erzgxb4s
ファイルが巨大になると、
いちおう変換できたとしても、
変換後ファイルにエラーが発生しやすくなるね


526:名無しさん@3周年
10/04/16 15:32:15 ZTO5u5mM
わかる方、教えてください。
自分で作った用語集や、ネットの用語集をエクセルにはり付けて、
タブ区切りのテキストファイルにしてから、クリエータを使ってみたところ、
複数の行で「使えない文字があります」というエラーが出て、ファイルが作れません。

どういった文字がエラーの原因になるかおわかりになる方いらっしゃいますか?
英数字や記号、スペース、全角/半角 などでしょうか? Σなどのせい?
エラーが出る行が多く、よくわかりません。

527:名無しさん@3周年
10/05/24 19:55:45 WgW8aPsW
すみません。教えてください。
英語版WikipediaをEPWING化するために、enwiki-latest-pages-articles.xml.bz2を
ダウンロードするのですが、何度ダウンロードしても、解凍すると、ファイルが壊れているという
エラーメッセージで解凍できません。解凍ツールも3種類使ってみましたが、だめでした。
日本語版は問題ありません。何が悪いのでしょうか。

528:名無しさん@3周年
10/05/24 22:44:42 3fHdMNLZ
>>527
URLリンク(download.wikimedia.org)
これもダメですか?

現在wikipediaは全言語版でバックアップ処理に問題が発生しているようで、
日本語版ダンプデータも2010/3/28を最後に作成されていません。
URLリンク(dumps.wikimedia.org)


529:名無しさん@3周年
10/05/25 19:41:35 6FaRmqlB
>>528
ありがとうございます。過去のものもダウンロードしてみましたが、
だめでした。

530:名無しさん@3周年
10/05/25 23:20:55 5H4pn0iL
>>529
以前試したとき(3月下旬)には、
自分の環境では、
WinRarを使って解凍できた記憶です。

大きいファイルのダウンロードに失敗している可能性もあります。
ダウンロードツールを変更すれば、
上手くいくかもしれません。


531:名無しさん@3周年
10/05/30 22:58:43 QhtUpk7Y
これいつになったら64bit版Windows7に対応するの?

532:名無しさん@3周年
10/06/01 21:20:31 aQH61sSM
64bit版に対応する気はないでしょ

533:名無しさん@3周年
10/06/07 20:55:05 MLKgDuXl
SR-G7001Mをお尻のポケットに入れて常に携帯しているんだが、
知らない間に電源が入っているらしく、
いざ使いたいときに電池切れor2=3

534:名無しさん@3周年
10/06/08 08:14:25 wJ2fxZ6A
マジレスするとスレ違い

535:名無しさん@3周年
10/06/11 14:03:36 1wQKlkHT
Wikipedia日本語版の元データが久々に新しくなったので、
SII自作辞書用ファイルも新しく作成しました。

いつものところにWikipedia日本語版2010/06/07版をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.skydrive.live.com)

WinRarなどを使って01~16のファイルを解凍して使って下さい。


536:名無しさん@3周年
10/06/12 12:08:23 sEwvcMDd
いつもありがとうございます。
こっそりといただいてます。

537:名無しさん@3周年
10/06/12 13:37:38 TaN6Hhhs
>>535
いつもいつも乙

538:名無しさん@3周年
10/06/23 23:08:21 5x4lzZ/b
いつものところにSII自作辞書用Wikipedia日本語版(2010/06/20版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)


539:名無しさん@3周年
10/06/25 14:22:10 FiXk9SYh
いただいております。
できれば変更箇所ちょろっと教えてください。

PDIC使えるようにするのはまずいんでしょうか。

540:名無しさん@3周年
10/06/26 00:11:24 /88oeNpE
>>539
前の版(20100607)との内容的な変更箇所(差分)ということでしょうか。

下に書いた手順で作っており、
差分を作る、という方法ではないため、
内容的に何が変わっているのか把握していません。

作成手順
 ① Wikipediaのサイトから、全項目の内容が含まれている元データをダウンロード
 ② 元データを、自作プログラムなどで、SII自作辞書形式に直接変換
 ③ 数式データをmimetexで画像化
 ④ 変換後データと数式画像を用い、SII製ツールで辞書作成

また、自作プログラムは、
上記のように、元データからSII製ツール用の形式に直接変換しており、
PDICやepwingなど他の電子辞書形式に変換することを一切考慮していません。
ですので、現在の自分のプログラムでは、
元データを他の電子辞書形式に変換することは出来ないです。

画像付外字対応epwing形式のWikipediaを公開している方がいるので、
自分はパソコンでは画像付epwing版を使っています。

自作の変換プログラムに変更があった場合は、
「この辞書について.txt」ファイルに変更部分を書くつもりです。
ただ、最近はプログラムにほとんど修正を加えていないため、
特に何も書き加えていないです。

表部分をもっと見やすくしたいなど、
修正したい箇所はいくつかあるのですが、
いいアイデアが浮かばない・・・


541:名無しさん@3周年
10/06/26 00:21:32 GPH2giLK
レスありがとう!

なるほど。そりゃそうだ(^_^;)
ウィキペディアが編集されて新しくなったところが変わった箇所ってことだね。

ずいぶん前の話になるけど、数式を見られるようにしてくれて重宝してます。

他は…英○郎の変換方法とか知りたい。

542:名無しさん@そうだ選挙に行こう
10/07/10 17:33:22 aKauLqRU
winrarって有料なのかぁ

543:名無しさん@そうだ選挙に行こう
10/07/11 02:36:13 IYiab/ts
別にWinRARじゃなくても解凍できる
自分はALZip

544:名無しさん@3周年
10/08/01 14:20:20 dF/fCkCl
いつものところに、
Wikipedia日本語版(2010/07/29版)をアップロードしました。

545:名無しさん@3周年
10/08/04 01:39:51 tX34vwGi
いつもGJ

図はむりだよねえ。

546:名無しさん@3周年
10/09/03 12:07:22 NzcOhCM8
いまさらながらありがとう。

547:名無しさん@3周年
10/09/12 11:30:59 P/r8Uv9s
いつものところに、
Wikipedia日本語版(2010/09/10版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

前回(2010/08/27版)はsjis,unicode版の2種類作りましたが、
今回は通常通り、unicode版のみです。

548:名無しさん@3周年
10/09/12 15:19:37 4XWlnPMa
まいどどうもっ!

549:名無しさん@3周年
10/09/16 20:14:29 lWj47Epm
ありがたい。

550:名無しさん@3周年
10/09/17 22:05:58 LSaWGBQS
いつも本当にありがとうございます!!

551:名無しさん@3周年
10/09/20 11:45:56 z3krd37+
SL900Xを使ってるんだけど、SDカードにWikiのデータ入れると、
SDカード内Wikiの検索と表示が超遅くなるのは普通?
SDカードの種類とか、Classとか関係あるのかな?

552:名無しさん@3周年
10/09/20 15:36:51 dcLvDSSV
>>551
SR-7001Mを使っているけど、SDカードにWikiを入れると、
SDカードの検索のみならず、起動時間も遅くなる。
Class4の2GBにしたら少しだけ早くなった。

553:名無しさん@3周年
10/09/20 21:47:45 M91BdQay
自分が試した範囲では、
Wikipediaの検索・表示速度は、
検索している辞書のサイズと、
SDカード等の速度に影響されるようです。


554:名無しさん@3周年
10/09/22 23:03:40 oU+4C7ML
それって当たり前じゃ…

555:名無しさん@3周年
10/09/22 23:52:47 LdZf2D3O
そうでもない。
機械側のリードが低い時と、メディアのリードが低い時とあるから。
根本的な遅さは、自作辞書の場合、内蔵コンテンツと違う検索方法だからなんだろうけど

556:名無しさん@3周年
10/09/29 14:27:38 i5Wi96+c
いつものところに、
Wikipedia日本語版(2010/09/24版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

557:名無しさん@3周年
10/09/29 22:10:42 XaOfbXgz
SR9002でWikipediaが使えるようになりました。ちなみにSDカードはclass4の2GBです。
起動は遅いです。

558:名無しさん@3周年
10/10/03 20:42:35 CB3qxW1D
どの電子辞書を買うか迷ってたけど、このスレ見て900xを買いました。
サンクス>>556
これからも応援するよ

559:名無しさん@3周年
10/10/08 09:02:39 3dx8Qh9m
いつもご苦労様です。
世界中で900xを有効活用しているのは>>556だけなんじゃないかと思うんだ。

560:名無しさん@3周年
10/10/09 14:24:29 CJPJzzqw
いつものところに、
Wikipedia日本語版(2010/10/07版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

561:名無しさん@3周年
10/10/14 11:12:02 O6I68mQQ
とn

562:名無しさん@3周年
10/10/21 12:25:29 QBYZp1lH
S9002と生協モデルの901には仕様の違いがあるのでしょうか? 
詳しい方がいましたら教えて下さい。

563:名無しさん@3周年
10/10/21 22:56:49 Rdwrvyg1
いつものところに、
Wikipedia日本語版(2010/10/18版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

564:名無しさん@3周年
10/10/21 23:01:20 qdqba0/R
とn

565:名無しさん@3周年
10/10/22 13:24:39 Qc9hJIzb
>>562
SL901XはS9001と同じ

566:名無しさん@3周年
10/10/22 19:15:47 fuRzeG1V
>>565
ありがとうございます。 出来ればもう一つ教えて下さい。 
最近の機種であるS9002とSL902Xは中身は同一なのでしょうか? 


567:名無しさん@3周年
10/10/22 21:48:53 Qc9hJIzb
>>566
全く同じ
SIIのサイトの取扱説明書見れば分かる
2台共通で一つの取説だから

568:名無しさん@3周年
10/10/23 01:22:24 oUND1Xw9
基本同じだけど、
生協モデルの方は保証が良い

569:名無しさん@3周年
10/10/23 01:33:28 geWNYkxG
>>567>>568
教えて頂きありがとうございます。 
今まで紙辞書一筋でしたが電子辞書を使ってみようと思ったところ予備知識が無かったので悩んでいました。 
週明けに生協へ行ってみます。

570:名無しさん@3周年
10/11/04 22:53:55 gL0odzXY
いつものところに、
Wikipedia日本語版(2010/11/02版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

571:名無しさん@3周年
10/11/04 23:14:23 Uq0CtFUH
ありがとぅーーー!
最近入れたんだけど、wikipediaが入ってるのとそうでないのでは、電子辞書持ってる価値が全然違うね!
人・建物・土地・会社・曲・その他作品色々、 何でも調べられて、その補助に広辞苑とか使う感じになる。

572:名無しさん@3周年
10/11/05 09:20:21 bVmENbC2
今なら型落ちの901や900を買うのもありな気がする

573:名無しさん@3周年
10/11/09 15:42:16 uaZ806dz
wikipediaを有難く使わせてもらってるんだけど、
内容の途中で終わってたりするのは、端末側が対応してないってことなのかな?

574:名無しさん@3周年
10/11/10 00:05:12 wVFWwRZz
>>573
以下の3つについては、収録していません。
 関連項目
 外部リンク
 参考文献

以上については、作成プログラムで削除している部分ですが、
他にも一部切れているところがあるようです。
そういう項目は教えていただけるとありがたいです。

575:名無しさん@3周年
10/11/10 00:32:37 joE9mTxL
>>574
>>573じゃないけれど。
いつもおせわになってます!
長いやつは後ろの方が切れてる気がするよ。

576:名無しさん@3周年
10/11/10 06:19:37 vzBHNpv+
>>575
『▼次見出し』ボタンを押したら続きが見られるよ。

577:名無しさん@3周年
10/11/10 08:43:58 2g2VXkUC
>>576
次に続いてるのか!なるほどやってみる。

578:名無しさん@3周年
10/11/10 16:35:29 WDIMWkVC
>>576
おおおおー 気付かなかったよー 39!

579:名無しさん@3周年
10/11/20 16:39:23 70yy6ylo
>>503
URLリンク(download.wikimedia.org)
に一週間くらい前から繋がらないんだけど、無くなったの?

580:名無しさん@3周年
10/11/20 23:43:20 894kRaJQ
URLリンク(download.wikimedia.org)

サーバーメンテナンスのため、現在ダウンロード不可

581:名無しさん@3周年
10/11/21 10:53:17 OPVs6pUS
>>580
そんなにいつまでもかかるか?

582:名無しさん@3周年
10/11/27 09:33:41 DJigvLYu
英語版のepwingがでてる

583:名無しさん@3周年
10/11/27 12:39:22 T1KEWoc3
URLリンク(page5.auctions.yahoo.co.jp)

584:名無しさん@3周年
10/11/30 21:12:29 0YjU2YpG
URLリンク(page5.auctions.yahoo.co.jp)

585:名無しさん@3周年
10/12/15 20:22:43 Ip3XR0YH
wikipediaいれさせていただきました。



586:名無しさん@3周年
10/12/18 04:24:54 TaAXto9t
wikiのアニメ関連・アイドル関連の情報をこれほど邪魔に感じるとはw

587:名無しさん@3周年
10/12/18 15:52:22 sNfQT4HP
そう?
昔やってた「まんが日本史」っていうアニメを今朝ふと思い出して
Wikipedia見たらかなり詳しく載っていて役に立ったよ

588:名無しさん@3周年
10/12/19 01:45:40 deVj685P
排除するのは難しいだろうな。

589:名無しさん@3周年
10/12/19 07:54:28 uN8YO0wO
wikiありがとうございます

590:名無しさん@3周年
10/12/20 01:54:30 eQ1Ci7Qo
>>586
俺もずっとそれ思ってるw
ゲイスポ関係外したら1/3ぐらいに軽くなりそうw

591:名無しさん@3周年
11/01/10 00:38:20 IMxL2Hiy
オッス!

592:名無しさん@3周年
11/01/20 20:10:13 ZLpQW1Jf
>>579
更新されないね

593:名無しさん@3周年
11/01/31 02:52:09 CtAKC296
SII用Wikipedia日本語版(2011/01/29版)をアップロードしました。
URLリンク(cid-5c09af0e4358cc4b.office.live.com)

久々の更新で、色々とミスが目立つかもしれません。

594:名無しさん@3周年
11/01/31 02:54:51 48OpfY4o
キター
いつもありがとうございます

595:名無しさん@3周年
11/01/31 02:57:44 EcOV03Bd
うおおおお更新ktkr


さっそく落としていれさせてもらいます
ありがとう

596:名無しさん@3周年
11/02/06 18:55:32 kPJLAFSl
セイコーは>>593に感謝すべきだな。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch