mozc / Google 日本語入力 #1 at LINUX
mozc / Google 日本語入力 #1 - 暇つぶし2ch2:login:Penguin
10/05/13 13:35:59 O0qZ7dj/
現時点でパッケージを配布しているサイトを調べてみた

Mandriva
URLリンク(www.geocities.jp)

FedoraとUbuntu
URLリンク(linux.ikoinoba.net)

PCLinuxOS
URLリンク(tomcat.nyanta.jp)

Momonga
URLリンク(b.awn.cc)

Fedora
URLリンク(tagoh.fedorapeople.org)

ほかにあれば追加よろしく

3:login:Penguin
10/05/13 13:40:57 O0qZ7dj/
debianに取り込まれるようだ
URLリンク(bugs.debian.org)

4:login:Penguin
10/05/13 14:06:04 y0/Hl/0B
Arch Linux
URLリンク(aur.archlinux.org)

5:login:Penguin
10/05/13 15:08:09 y0/Hl/0B
tomcat氏のパッケージにGoogle日本語入力のアイコン (もしくはそれにクリソツな物)
使ってるみたいだけど、これライセンス的にヤバくないの?

6:login:Penguin
10/05/13 15:29:54 O0qZ7dj/
どんなのか知らないけど似てるだけなら問題ない

7:login:Penguin
10/05/13 15:44:26 y0/Hl/0B
少なくとも上海万博のテーマソングよりオリジナルに似てる。
というかそのまんまなかんじ。

8:login:Penguin
10/05/13 17:23:04 xS73WnAg
ダメならGoogleが警告するでしょう。

9:login:Penguin
10/05/13 18:18:47 SrfxWAX1
>>5
アイコン差し替えたらしい。

10:login:Penguin
10/05/13 18:38:28 y0/Hl/0B
ほんとだ、仕事が速い。
mozcのバグトラッカーにも「アイコンつけてくれよ」的な要望があがってたから、
そのうちchromuimみたいにmozc用アイコン用意されるかもね。
っていうかそれに期待。

11:login:Penguin
10/05/13 19:55:32 VXGGLAQH
googleがibusを選んだことでibus最強伝説が始まるのかな

12:login:Penguin
10/05/13 23:15:19 Nw/pWA1B
顔文字はないのか?
先読みした文字列を選ぶのにはtabキー使うのか。
マウスで選んでも反映されないな。

13:login:Penguin
10/05/14 00:19:52 jXUhgslI
候補に数字が振られてるから数字キーで選べるのかと思ったら、それもダメだった。

14:login:Penguin
10/05/14 00:27:46 Z50AdfD5
普通にカーソルキーで選べるよ

個人的にはスペル判らない英単語がくろーむとか読みで変換出来る奴が欲しいかな、
順位は一番下でいいんだけど。

15:login:Penguin
10/05/14 05:12:52 1eOIuraW
〇〇県とか〇〇市とか一発で出ない

16:login:Penguin
10/05/14 20:05:21 V8YokLRh
モズク?と呼べばいい?海のモズクになるかな?w

17:login:Penguin
10/05/14 20:12:46 RKoNrI9+
>>16
えっ?

18:login:Penguin
10/05/14 20:51:26 UhlYQllq
>>16

URLリンク(internet.watch.impress.co.jp)
> Google日本語入力をオープンソース化するプロジェクトは、「Mozc(モズク)」と名付けられ、専用サイトでの情報公開やソースコードの提供などが始められた。

19:login:Penguin
10/05/14 21:27:35 /QeyC4hy
なるも何もモズクは元から海のものなんだぜ

20:login:Penguin
10/05/14 21:48:39 zcXnY/Qu
チラシの裏
「海の…と消える」「海の…となる」
○「もくず(藻屑)」
×「もずく(水雲,海蘊)」
URLリンク(kotonoha.cc)

21:login:Penguin
10/05/14 23:00:47 16GEbLzF
何にせよでたばっかなんでこれからに期待
オープンソースなんで誰がいじってもいいんだが出来ればきちんとしたプロジェクトが欲しいところ

22:login:Penguin
10/05/14 23:12:54 Ivit4eRw
Linuxでは、変換は半ば諦めていたがついに来たか。
はじまったばかりとはいえ、変換効率ではすでにAnthyとは比ぶべくもない。
まあ、「くらぶべくもない」は変換できなかったわけだが。

記念カキコ@Arch Linux

23:login:Penguin
10/05/14 23:29:32 GNLYfS8s
設定画面が実装されるまでの代わりになりそうなもの発見。
URLリンク(github.com)

24:login:Penguin
10/05/14 23:30:30 GNLYfS8s
h抜き忘れた、ごめん

25:login:Penguin
10/05/14 23:33:14 tJIzuQ9X
未だにhがどうこう言ってる人いたのか

26:login:Penguin
10/05/15 00:50:34 zuogiZUr
さっそくいれてみた>mozc-config
Arch用。
URLリンク(aur.archlinux.org)

27:login:Penguin
10/05/15 01:12:29 CRGQ+MuZ
>>2に追加。

Momonga用spec file

URLリンク(developer.momonga-linux.org)

28:login:Penguin
10/05/15 01:17:28 nnVyvNGN
mecabの作者がからんでるみたいだし、今後も期待できるよな。
日本語変換関連で有名なハッカーみたいだし。

29:login:Penguin
10/05/15 13:02:02 0uvn7PI2
>>3見ながら入れてみた@xubuntu9.10
アイコンはやっぱり寂しい気がする

30:login:Penguin
10/05/15 13:18:00 OvnKkS2u
アイコンはよーわからんが自分でビルドしたやつなら
/usr/share/ibus-mozcにproduct_icon.pngでアイコンに
したい画像をおいてmozcを再起動してやると表示されるよ

mozc.xmlに書いてあった

31:login:Penguin
10/05/15 13:35:54 0uvn7PI2
>>30
レスありがと
自前ビルドなんだけど/usr/share/ibus-mozcがなかった
どこにいったのかちょっと調べてみる

32:login:Penguin
10/05/15 13:39:51 OvnKkS2u
>>31
/usr/share/ibus-mozcは多分つくってやらないとないと思われる

sudo mkdir /usr/share/ibus-mozc

でつくるといいと思うよ

33:login:Penguin
10/05/15 13:44:30 0uvn7PI2
ごめん。自分でディレクトリ作って、そこに放り込めばよかったんだね

34:login:Penguin
10/05/15 13:45:58 0uvn7PI2
調べている間にレスが付いてた
リロードしときゃよかったorz
重ね重ねありがとです


35:login:Penguin
10/05/15 15:39:19 WBC1KGbj
VineSeed
URLリンク(ml.vinelinux.org)

36:login:Penguin
10/05/15 19:49:54 xsBDhuUs
「もずく」って俺の地方の方言では「チン毛」の事なんだけど皆さんの住んでる処ではどうですか?



37:login:Penguin
10/05/15 20:30:24 WBC1KGbj
>>36
「もずく」ではない。「Mozc(モズク)」だ!


38:login:Penguin
10/05/15 20:47:44 dl5VQhEj
方言というより、その地域でよく使われる暗喩表現じゃね

39:login:Penguin
10/05/15 21:11:41 +VLrpVYE
なんかネーミングが悪いよね。Mozukuにするべきだった。

40:login:Penguin
10/05/16 00:01:11 bGG7bl+1
検索に引っかからない単語を選んだのでは。

41:login:Penguin
10/05/16 00:20:06 kVBIoRlz
mozc悪くないね
Anthyは、漢字は知ってるけど日本語がわかってない感じだった
mozcはちゃんと日本語が分かっている感じがする
文節を区切って変換する人は、Modified Anthyのほうが幸せになれるだろうけど
長文を打つ人やAtokに憧れてる人にはいいと思う

42:login:Penguin
10/05/16 01:52:18 SQrMrh4P
mozcは名前をみれば作者がわかるからね。mecab/mozcとくればつぎなんだろうね
という程度。

43:login:Penguin
10/05/16 01:55:41 SQrMrh4P
>>40
検索屋がつくってるから、それはあるんだろうね。

44:login:Penguin
10/05/16 03:16:46 Jq+w1ra8
つぎは
ひじき
つづり
ふめい

45:login:Penguin
10/05/16 07:19:55 KwS5bda1
ひじきに一票

46:login:Penguin
10/05/16 07:27:28 LEPWL7ld
awabi

47:login:Penguin
10/05/16 07:45:50 s4uMTR0w
「もずく」(チン毛) の次は 「わかめ」(マン毛)だろ

48:login:Penguin
10/05/16 09:40:49 LEPWL7ld
入力モードのアイコンは出せないのか。。。

49:login:Penguin
10/05/16 10:57:27 dqv9F0yk
固有名詞とか普通に出てくるようになった
乗り換えない理由がなくなったな

50:login:Penguin
10/05/16 20:42:16 eFgJW+/G
最後をdで「ど」と読む海藻類・・・

51:login:Penguin
10/05/16 20:45:09 MN751rmN
URLリンク(twitter.com)

>Google 日本語入力のOSSは、例の辞書がないから無意味とか言われると、とても残念だ。

お前ら批判されてるぞw

52:login:Penguin
10/05/16 20:55:31 mCXM9j+3
猫に小判って事さ。
向こうはプロ。批判しているのは素人。

そしてオイラはSKKユーザだから対岸の火事w

53:login:Penguin
10/05/16 21:00:27 cH9XZXAo
ボール乗りにガンダムが配備されると勝手に思っただけで、別にガンタンクが配備されたからって拗ねてませんよ。

54:login:Penguin
10/05/16 21:30:36 BYyS/9z2
エスティマハイブリッドを注文したらガソリンエンジンの
エスティマが届いたでござるの巻

55:login:Penguin
10/05/16 21:59:20 kKWK8GP9
uim使ってるオレはibusにしか対応してないから拗ねてるけどな。

56:login:Penguin
10/05/16 22:21:33 LDcnnSF/
mozcは、使うアプリによっては、注目している文節の位置が分かり難いね。
GTK_IM_MODULE=xim にすると分かり易くなるけど、今度は変換候補窓が明後日な位置に出ちゃう。


57:login:Penguin
10/05/16 23:01:01 sGArlv0L
>>52
っていうか、SKKってつまりKAKASIの辞書ってことでしょ?
あれぶち込んだら熟語系は結構補完できないものだろうか?

>>55
しかし汎用プロトコルサーバって作れないものかな?
pulseadioみたいに対応アプリによって別プロトコルのサーバに見えるみたいな。


58:login:Penguin
10/05/16 23:01:17 dqv9F0yk
例の辞書使えるようになってるけどな

まなか→真中瞳
かるろ→カルロス・ゴーン
ぱんく→パンクブーブー
ばらく→バラク・オバマ
しゃんはいば→上海万博
とある→とある科学の超電磁砲
そらの→ソラノヲト

アップデートで辞書更新してるのかな?


59:login:Penguin
10/05/16 23:39:56 mCXM9j+3
>>58
そんなフランクな辞書嫌だ……

60:login:Penguin
10/05/16 23:41:22 +DbqisIG
漏れのでは
かるろ->カルロス
    ->カルロスゴン

だけどw「かるろすご」までいくとゴーンが出てくるけど

61:login:Penguin
10/05/16 23:47:19 tIejJQ9m
まなか→茉奈佳奈

62:login:Penguin
10/05/17 00:05:58 MPHEbhtS
>>58
例の辞書と言われても一昨日使い始めたばかりなのでわからないけど、なんかパワーアップしてるね。
どういう事なんだろうこれ?

63:login:Penguin
10/05/17 00:35:56 6iXl9CjZ
なんでパッケージの入手元を書かないかね。
あ、うぶん厨か。

64:login:Penguin
10/05/17 01:46:43 MPHEbhtS
っていうか、野良ビルド入れようとしててふとapt掛けたら入っちゃって拍子抜けした訳で。
何もせずに只更新しただけで辞書が充実するなんて初めての経験だわ。

65:login:Penguin
10/05/17 01:47:27 1JzuPqRl
>>63
URLリンク(goo.gl)

66:login:Penguin
10/05/17 02:26:09 L4lIJaWJ
>>23で紹介されてた mozc-config にGUIが実装されたよ。

67:login:Penguin
10/05/17 08:17:33 SrnXuvoJ
>>58
時間が経つとこの変換ができるようになるの?なんで?
まなか がまだでないよ。

68:login:Penguin
10/05/17 09:00:55 3VvgwkSa
>>67
野良パッケージを使ってて、その野良が辞書追加してくれてるだけ。

69:login:Penguin
10/05/17 09:50:39 LXrt6Hw/
>>51
辞書が使えなくて既存よりちょっとマシ程度では、夢と希望の99%は潰えたわけで
この分野では(IMだけでなく自然言語処理)一緒に夢を見させてはくれないということね。
ちょっとM$のようで幻滅。

70:login:Penguin
10/05/17 09:54:20 GgtwhzgO
>>69
MicrosoftもGoogleも営利企業だから、営利優先なのは仕方ないだろう。
Googleに変に期待するのは間違いというものだ。

71:login:Penguin
10/05/17 10:15:13 LXrt6Hw/
>>70
M$とgoogleではブランドイメージが違うよ。というか違ってた。
今は足元が見えなくなった似たような巨大企業に見えるって話。脱線してるね。

72:login:Penguin
10/05/17 14:20:04 C9+QIeWJ
>>71
あんたが勝手な思い込みで過剰に期待してただけじゃないのか、それは

73:login:Penguin
10/05/17 15:24:58 wWBDQlhu
mozc-configのmozc再起動オプションがうまく働かないのは俺だけ?
とりあえずmain.ccをこうしてみたら再起動してくれるようになった。

int reboot() {
- const char *path = "/usr/bin/killall";
+ const char *path = "/usr/bin/ibus-daemon";
char *const argv[] = {
- (char *)"/usr/bin/killall",
- (char *)"ibus-daemon",
+ (char *)"/usr/bin/ibus-daemon",
+ (char *)"-rdx",
(char *)NULL
};


74:login:Penguin
10/05/17 16:24:41 m44FgXbZ
Googleはケチっぽいな

75:login:Penguin
10/05/17 18:00:46 MPHEbhtS
>>67
うちは>>61と同じだわ。
学習してるんじゃないの?
例えば曹操とか一度分けて変換したら次から出るようになったよ。

>>68
とりあえずmozc用にapt line追加したりはしていないんだよね。
モデファイアンシーの時に色々やってたのが効いてる気がするけど覚えてないや。

辞書はどうやらそれ由来の奴が追加されたのかな?
しかしそれだけでこれだけ印象が変わるというのは発見だと思う。
anthy用の辞書がこんなに使えるものだったなんて、
単にグーグル変換使ってるだけじゃ気がつかなかっただろうな。

76:login:Penguin
10/05/17 18:21:38 z+wFOyNB
>>71
そりゃ勝手に期待していただけで、まともな人は MS も Google も同程度に evil
だって思っているよ。(Google が evil じゃない程度には MS も evil じゃない)

>>69
(MeCab も使っている) IPADic は40万語の辞書をフリーで公開してくれていて、
MeCab も Mozc もその恩恵を最大限に受けているわけだが、
それで自然言語処理まで幻滅と言うのは言い過ぎだと思うぞ。
Debian かなにかに入っている Cannadic を使った ChaSen でも使ってみるといいよ。
「ちょっとマシ」どころではない。
そして、Mozc みたくデータ構造やアルゴリズムまで惜しみなく公開してくれてるんだから、
うだうだ言ってないであとは自分で作ればいいじゃん。

77:login:Penguin
10/05/17 18:57:08 L4lIJaWJ
今 gclient sync したら リビジョン 14 だったんだけど、13 と何が変わったのか分からん。

78:login:Penguin
10/05/17 19:04:56 bWqpYvJz
>>77
WinとOSXの開発版がアップデートされたからそれに伴う変更だと思うけど。
変換周りでの変更では口語表現の変換精度の向上とあるから、その辺の変更だと思う。

79:login:Penguin
10/05/17 19:09:36 6iXl9CjZ
>>77
Change Log みろよ。wikiの更新だけ。
mozcソースはr10から更新されてない。

80:login:Penguin
10/05/17 19:16:14 MPHEbhtS
>>76
まあ、グーグルは検索売ってる会社でMSはOS売ってる会社だからな
本業絡みのフリー公開要求は酷でしょ。
只、オマケに関する考え方はかなり違うんじゃないかな?

日本語変換に関して言えば、各社公開してきた中で、MSが公開したのはAPIだけだろうか?
DOS用のFEPが利用できたりしたのにはそのお陰もあっただろうとは思うけど。

81:login:Penguin
10/05/17 19:21:14 bWqpYvJz
すまない。ソースは更新されていないね。
もしかすると、OSSで公開したときにWinとOSX用の変更も入っていたのかも。

82:login:Penguin
10/05/17 21:50:10 MPHEbhtS
Mozc-0.11.356.0 というのは結局何を表しているのだろうか?

83:login:Penguin
10/05/17 22:08:20 6iXl9CjZ
バージョンでしょ。どこで表示されるのか知らないけど。

84:login:Penguin
10/05/17 22:41:05 otewHu6c
> 669 login:Penguin sage 2010/05 /11(火) 12:12:07 ID:GIqwpOCz
> 10.04 にibus-mozc_0.10.288.102-1_i386.deb を入れてみた
> 「バージョン」を変換して表示されるバージョンは「Mozc-0.11.352.0」みたいだね

公開時のバージョンはMozc-0.11.352.0 だったね

85:login:Penguin
10/05/17 22:45:05 sen2xgUr
今はMozc-0.11.357.0だよね

86:login:Penguin
10/05/17 22:51:53 LXrt6Hw/
>>76
幻滅しているのは結局皆で協力して作る体制でないこと。

googleの収集能力に皆の知恵を合わせればきっといろいろな素晴らしい辞書や
それに見合うさまざまな自然言語処理ロジックができると思う。ロジックなんて
データとセットだと思うし、基礎分野で直接金儲けなんて所詮無理だと思うんだよね。
それが望みなら個々にやってもいいんだけどさ。つまらないなと思って。

87:login:Penguin
10/05/17 23:30:39 MPHEbhtS
>>86
よくわからないけど、そんなの単に呼びかければいいだけの話じゃないの?
それとも鍋パーティーで持参した材料が期待はずれだったって話?

88:login:Penguin
10/05/17 23:43:37 6iXl9CjZ
バージョン番号の3つ目は、ビルドした日で決まる。2009年5月24日からの日数。

89:login:Penguin
10/05/17 23:46:25 LXrt6Hw/
>>87
出された料理にケチつけてるだけだぞ。正直言ってガッカリだって。

90:login:Penguin
10/05/17 23:51:36 MPHEbhtS
>>89
まずそれが理解できないんだよな。まだそんなバージョンじゃないような気がするし。

91:login:Penguin
10/05/18 00:02:35 B2LkaHDw
>>88
うん。
// mozc_version_template.txt
MAJOR=0
MINOR=11
BUILD=daily

// mozc_version.py
if expand_daily and self._build == 'daily':
zero_day = datetime.date(2009, 5, 24)
self._build = str(
datetime.date.today().toordinal() - zero_day.toordinal())

ソースの改変に関係なく毎日バージョンが上がる。

実際のソースのバージョンはこれ、
$ ./gclient revinfo
src: URLリンク(mozc.googlecode.com)
src/mozc_build_tools/gyp: URLリンク(gyp.googlecode.com)
src/protobuf/files: URLリンク(protobuf.googlecode.com)
src/third_party/gtest: URLリンク(googletest.googlecode.com)
「0.11.16」ってことになるのかな

92:login:Penguin
10/05/18 00:18:46 vzn3LFMg
>>90
ん?早合点なのかな?もう少し待ってみよう
面白そうになったらまた来るよ

93:login:Penguin
10/05/18 00:57:27 ek1o3lz7
>>86が言ってることはわかるけど、googleの収集能力はプライバシー問題と切り離せないってことや
Win版で問題になってる意図的に間違った語彙やエロ単語ばっかり送ってる連中がいること忘れてないか?
世の中きれい事だけで出来てるわけじゃないしな

94:login:Penguin
10/05/18 08:59:01 JWxOBNY+
誤変換でエロとか隠語ばかりでてくればやっかいだもんな。
個人的な予想だけど、辞書は辞書で別に育てるプロジェクトが
できるんじゃないの?核になる辞書はすでにあるんだし。

95:login:Penguin
10/05/18 10:03:01 LImcuvrf
てすと
URLリンク(tools.google.com)

96:login:Penguin
10/05/18 13:47:49 70sjXmJM
> きちんとパッケージングしたい時は、ibus-setup-mozc(pythonスクリプト)内で
決め打ちされている LOCALE_DIR の値を適切なパスで書き換えてください。


ibus-setup-mozcのLOCALE_DIRに書くパスはどのように書けばいいのでしょうか?
とりあえずLOCALE_DIR = /home/Mydir/.mozcとしたけどダメでした

97:login:Penguin
10/05/18 14:10:36 5Kw0K1CN
>>96
やっつけで書いた汚いパッチですが、ご参考までに。
URLリンク(aur.archlinux.org)

setup.glade は /usr/share/mozc-config/setup.glade を想定。
ja.mo は /usr/share/locale/ja/LC_MESSAGES/ibus-mozc.mo を想定。

で、mozc r18 でソースに更新が入り、mozc-config の make が通らなくなりましたよと。

98:login:Penguin
10/05/18 14:13:23 70sjXmJM
>>97
早速の対応ありがとうございますm( _ _ )m


99:login:Penguin
10/05/18 14:25:57 70sjXmJM
>>97
でもスキルがないので使い方わからないです(つд⊂)エーン

100:login:Penguin
10/05/18 21:20:30 zuDAgc9p
辞書鍛えられた、俺のuim、primeと比べたらまだまだだね、というか専門用語が
当て字でないとでないので登録できないのは致命的だと知った今日この頃でした

101:login:Penguin
10/05/18 21:34:46 v2MqqeZ1
無変換押しても認識してくれないのはどうすりゃいいの?
ひらがな->カタカナにしたいときとか

102:login:Penguin
10/05/18 21:57:33 9S8dCsGu
r21まで上がってるね。結構、変更入ってそう。

103:login:Penguin
10/05/18 22:04:54 5Kw0K1CN
ソースに変更が入ってるのはr18のみ。
しかも変更内容が全然書かれていないLog。

104:login:Penguin
10/05/18 22:05:49 ob1SjPRd
mozc-config -s session_keymap MSIME

105:login:Penguin
10/05/18 22:22:09 Cw6VPgaB
>>100
ビルド時に辞書へ登録すればいいと思って、登録様式を眺めているが
まだ理解しきれていない。

106:login:Penguin
10/05/18 23:04:29 7/hsmRtM
>>105
URLリンク(www.geocities.jp)
そんなあなたにここで公開されている[開発者向け] Mozc辞書生成用のスクリプトとデータ
というのを使うと幸せになれるかも
Rubyで書かれているらしいから、Rubyを解釈できるなら適切な形に書き換えると汎用性
アップするかも

107:login:Penguin
10/05/18 23:26:18 5Kw0K1CN
mozc-configで単語登録できるようになった模様。

108:login:Penguin
10/05/19 00:07:33 Abp89he5
>>104
サンキュー

109:login:Penguin
10/05/19 01:29:49 OiNM5kLh
>>86
幻滅もなにも、Googleはこれまで検索インデックスも検索アルゴリズムも公開していない。
(PageRank は公開したが、あれはもはや数千とも数万とも言われるランキングの特徴量の一つにすぎない)

Search Wiki で検索結果にみんなの知恵を合わせる方法も、去年一時期やっていたが止めた。
そもそも協力するという会社ではない。

オープンソースはばんばん利用して、少しだけ(20%ルールでやった部分)公開する。
もともとクローズドな会社でしょ。MS と同じくらい evil だって知らないで騒いでいるだけだよ。
Google 日本語入力はもう20%ルールではないし、公開できない部分が増えても当然。

110:login:Penguin
10/05/19 04:20:37 MWVh65Mq
>>101
F7

111:login:Penguin
10/05/19 08:20:38 f/GdZ3Wf
>>101
>>110
mozcに限ったことではない。スレ違い氏ね。


112:login:Penguin
10/05/19 08:40:33 YHsJ/j49
>>111
>>104

>>107
mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
ところでこれ消すのはどうするんだろう?

113:login:Penguin
10/05/19 09:06:43 7ZniSmP+
r21、ビルドできないぞ…。

114:login:Penguin
10/05/19 09:22:08 Abp89he5
漏れはdebuildしてるけど、依存関係でエラーでたから、それインストールしてやったらでけた。
libprotobuf-dev libgtest-devだったと思う。

115:login:Penguin
10/05/19 09:26:47 7ZniSmP+
>>114
うわーほんとだ! Wiki の依存項目も更新されてるのを見落としてた。
さんくす。

116:login:Penguin
10/05/19 14:34:36 bawMocvX
>>112
> mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
> ところでこれ消すのはどうするんだろう?

修正および消去が実装された模様。

117:login:Penguin
10/05/20 23:06:32 GdrSg3LG
mozc-configの中の人ここ見てるかなあ。
make install を実装したのはいいけど、ibus-setup-mozc 忘れてますよ(´・ω・`)
バグトラッカーにあげるのも躊躇するほどのアレだし…

118:117
10/05/20 23:21:12 GdrSg3LG
いや、忘れてない、俺の勘違いだった。

119:login:Penguin
10/05/21 03:04:25 YmYjM0UN
だめだ。ibusに耐えられない。
uimで実装してくれ。

120:login:Penguin
10/05/21 08:17:43 2eer+h5s
画面の下の方で入力してると予測候補のリストが入力中の文字を隠してしまう。
これもibusの問題かなあ。
あと、候補リストの矢印アイコン。あれ、いらんやろ。

121:login:Penguin
10/05/21 11:06:48 ivOBc5wp
そのむかしiDic入れたとき、クソのような人名と品詞の影響による誤変換で泣きたくなった。
誰がチェックしたかもしれない辞書による、余計なお世話の予測変換は虫唾がはしる。
日本史辞典の水準で人名と固有名詞が登録されている辞書なら欲しいんだけどな。
カタカナ単語は、変換後に慣用語として自動登録してくれりゃいい。

122:login:Penguin
10/05/21 17:19:42 9H77kE5p
r23に上がってるね。ibus周りの修正みたいだけど。

123:login:Penguin
10/05/22 07:00:25 vjYfauX/
さぁ、今日も辞書を鍛える作業が始まるよ!

124:login:Penguin
10/05/23 02:07:57 UspU2FkD
学習の保存量ってどれぐらいだろ?
すぐ忘れてる気がする

125:login:Penguin
10/05/23 15:50:41 FDXRwsL4
ibus-setup-mozcの「Sellection Shortcut」は,「l(エル)」が一個多いな.


126:login:Penguin
10/05/25 20:03:59 D0kMVtAD
mozc 開発は日本人の最後のフロンティアだな

127:login:Penguin
10/05/26 11:44:05 tVqPx3QC
キーバインドが良くわからんです。
変更するってのは検索すればみつかるんだけど。
ことえり準拠?
それでもよくわからんです^^;
と、skkばかりつかってる人間です。

128:login:Penguin
10/05/26 19:31:15 ttKtttaQ
URLリンク(twitter.com)
「Google でインターンをしませんか?」のRTの嵐。
全然役に立たねえ。

129:login:Penguin
10/05/27 02:12:08 8D3Mnw58
ibus-mozc-dictの話題が皆無な件について

130:login:Penguin
10/05/27 04:01:18 A7Erm6S6
いつの間にか入ってましたMozc Dictionary Tool。ありがたいこってす
カラムとボタンの文字が日本語じゃないのは何ででしょう

131:login:Penguin
10/05/27 12:37:26 6uBEpbK/
そろそろdebianのtestingに入れてください

132:login:Penguin
10/05/27 13:40:36 rhN036Jj
Google 日本語入力の開発版をアップデートしました。 (Ver 0.11.365.10x)
URLリンク(googlejapan.blogspot.com)

ちょっとビルドしてくる

133:login:Penguin
10/05/27 14:03:04 MgqFshjq
>>131
まだunstable にもはいってないよ

134:login:Penguin
10/05/27 14:54:09 oxCJ8BjK
>>132
mozc-config 短い命だったなあ。

> # Google 日本語入力と同様、変換エンジンを別プロセス化することにより、
> 他のインプットメソッドフレームワーク (SCIM 等) と共存しやすくしました。

+   +
  ∧_∧ + 
 (0゚・∀・)    ワクワク
 (0゚∪ ∪ +     テカテカ
 と__)__) +

135:132
10/05/27 15:07:30 rhN036Jj
>>132
無事、環境設定も辞書登録もできるようになったね
これでWine 経由で辞書登録しなくてすむよー

136:login:Penguin
10/05/27 16:20:41 oGq87vUm
都道府県名入力の改善って偉く強引だな
結局、品詞を細かく処理するより辞書に放り込む方が効率的なのか

137:login:Penguin
10/05/27 16:25:06 cGg44XXv
qt4関連の依存が増えましたね。

138:login:Penguin
10/05/27 16:51:15 6tiTtwJ6
>>134
mozc-configってgtk系じゃなかったっけ。
qt4依存が嫌な人にはいいかもしれないよ

139:login:Penguin
10/05/27 16:54:00 n0R4gbiR
Gentoo使いとか特にな。インストール時間に雲泥の差が・・・・

140:login:Penguin
10/05/27 16:58:01 oxCJ8BjK
>>138
qtが必要なのはビルド時だけ、ということになっている。

141:login:Penguin
10/05/27 17:19:35 oxCJ8BjK
あれ? 依存する qt のパッケージが Wikiと debian/control とで違ってるなあ。
俺うぶんちゅじゃないから関係ないけど。

142:login:Penguin
10/05/27 17:45:50 YRoffuhF
あ・・・
ちょっと教えて下さい。
ibus_mozc は ibus-engine-mozc へ
mozc_server, mozc_tool は何にリネームすればよし?

143:login:Penguin
10/05/27 18:06:00 oxCJ8BjK
そのままでよろし。

144:login:Penguin
10/05/27 18:19:27 YRoffuhF
自己解決。
/usr/lib/mozc を作成してそのまま放り込むのね。
/debian/rules 読んで解決しますた。

145:login:Penguin
10/05/27 18:21:48 rhN036Jj
言語パネルを表示しない人向け

Mozc 辞書ツール
/usr/lib/mozc/mozc_tool --mode=dictionary_tool

Mozc プロパティ
/usr/lib/mozc/mozc_tool --mode=config_dialog

146:login:Penguin
10/05/27 19:26:45 DRUPPUiv
何かビルドすると競合が起きてエラーが出るようになった。
1回全部消して再ビルドしても同じだった。

# debuild -uc -us
dpkg-buildpackage -rfakeroot -D -us -uc
dpkg-buildpackage: set CFLAGS to default value: -g -O2
dpkg-buildpackage: set CPPFLAGS to default value:
dpkg-buildpackage: set LDFLAGS to default value: -Wl,-Bsymbolic-functions
dpkg-buildpackage: set FFLAGS to default value: -g -O2
dpkg-buildpackage: set CXXFLAGS to default value: -g -O2
dpkg-buildpackage: source package mozc
dpkg-buildpackage: source version 0.11.365.102
dpkg-buildpackage: source changed by Yasuhiro Matsuda <mazda>
dpkg-buildpackage: host architecture i386
dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp
dpkg-buildpackage: warning: Build dependencies/conflicts unsatisfied; aborting.
dpkg-buildpackage: warning: (Use -d flag to override.)
debuild: fatal error at line 1340:
dpkg-buildpackage -rfakeroot -D -us -uc failed

147:login:Penguin
10/05/27 19:28:15 DRUPPUiv
とりあえず指示通り"-d"を付けたらビルド通った。

148:login:Penguin
10/05/27 19:28:27 v0MonnWY
いや…1340行目でエラーとあるが…1340行目確認したのかい?

149:login:Penguin
10/05/27 19:32:45 DRUPPUiv
と思ったらやっぱり同じエラーが出て駄目だ。

>>148
これからチェックします。

150:login:Penguin
10/05/27 19:38:48 rhN036Jj
>>146
>dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp

これは入れなくていいのかな

151:login:Penguin
10/05/27 19:40:49 cGg44XXv
>>150
僕はそれをapt-get installしてコンパイルとインストールをしたよ。

152:login:Penguin
10/05/27 19:53:47 6Y+ANOvv
漏れもそれを入れて、debuildしたよ

153:login:Penguin
10/05/27 20:05:53 DRUPPUiv
QT4関連のパッケージが入ってなかった…。
スレ汚し申し訳ないです。

154:login:Penguin
10/05/27 21:36:13 uPQpxNci
あえなくなってしまう を変換するには何を辞書登録すべきなんだろうか?


155:login:Penguin
10/05/27 21:38:22 dxF6D4ZX
ツールバーが駐車禁止マークなのはなんとかならんのか。
アイコンないの?

156:login:Penguin
10/05/27 21:43:58 Q5Q/OSyK
>>155
あなたがデザインして送ればいいじゃないか。

157:login:Penguin
10/05/27 21:54:18 izabMx5Y
そのアイコン、何処のディレクトリに何という名前で置けばいいのかな?
/usr/share/ibus-mozc 下?

158:login:Penguin
10/05/27 21:57:34 dxF6D4ZX
>>156
他力本願w
Chromeに対するChiromiumのように、青を基調になにかないかねぇ。
Google検索に間違って登録されてる朝昇龍が辞書ツールのお陰で朝青龍になってウマー

>>153みたいになったけど、何か必要なパッケージが増えたんだろうと思って素直に
sudo apt-get install g++ python libibus-dev libcurl4-openssl-dev libssl-dev zlib1g-dev libdbus-1-dev libglib2.0-dev libprotobuf-dev protobuf-compiler libgtest-dev subversion devscripts debhelper qt4-dev-tools gyp
やったら、ずらずらと追加されて、ビルド通ったから、コンパイル通らないとここで書くようなヘマしなくて済んだ。

159:login:Penguin
10/05/27 22:02:26 izabMx5Y
以前からUTUMIさんの辞書を追加してビルドしているんだけど、
今回のリビジョンではその辞書が有効になっていない様な気がする。


160:login:Penguin
10/05/27 22:06:57 YRoffuhF
>>159
>今回のリビジョンではその辞書が有効になっていない様な気がする。

\(^o^)/オワタ

大丈夫、有効になってる。

161:login:Penguin
10/05/27 22:09:36 izabMx5Y
>>160
あ、俺だけかorz

162:161
10/05/27 22:16:37 izabMx5Y
今までの ~/moz を削除して自動的に新しい ~/moz を作らせたら
UTUMIさんの辞書も有効になった。ヨカッタ∩( ・ω・)∩


163:login:Penguin
10/05/28 02:59:18 SzcMjVfl
unix/uim/mozc.cc:240: error: cannot allocate an object of abstract type ‘mozc::uim::Session’

で止まった。

164:login:Penguin
10/05/28 03:00:35 SzcMjVfl
ウ、誤爆

165:login:Penguin
10/05/28 15:23:31 XhIFu/as
mozc_serverが変換するようになったんだよね?
辞書を組み込みは以前と同じように dictionary1.txt でいいの?

166:login:Penguin
10/05/28 17:37:36 M6g8oFq5
>>165
いいよ。

本家uimもmozc対応に動いてるみたいね。

167:login:Penguin
10/05/28 17:58:58 M6g8oFq5
わーい、uim-mozcイイカンジ。

168:login:Penguin
10/05/28 18:04:24 mJqoHRFq
テスト

z+, ‥
z+. …
z+/ ・
z+h ←
z+j ↓
z+k ↑
z+l →

169:login:Penguin
10/05/29 00:32:58 yDWgz2cr
uim-mozcって、変換前入力中のカーソルの左右移動がおかしくない?
「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。
ibus-mozcだと問題なさげ。

しかし、俺って今までどんだけアホなIM使ってたんだよと、しみじみ感じている。
文章打つのがたのしくて仕方ない。

170: [―{}@{}@{}-] login:Penguin
10/05/29 02:01:59 AyL6o9sV
アイコンの設定はxmlじゃなくてソースに直書きのようで、
ソース漁って見つけた。
ツールのアイコンは
/usr/share/ibus-mozc/unknown.ico
でいけた。中身はpngでいけた。
この先もコロコロ変わるんだろうけど。

171: [―{}@{}@{}-] login:Penguin
10/05/29 02:08:24 AyL6o9sV
↑の名前に/usr/share/icons/gnome/scalable/categories/preferences-system.svg
のリンク貼ってもいけた

172:login:Penguin
10/05/29 04:26:35 AyL6o9sV
アイコンファイルらしきやつら
./unix/ibus/main.cc:const char kEngineIcon[] = "product_icon.png";
./unix/ibus/path_util_test.cc: const string &icon_path = GetIconPath("test.png");
./unix/ibus/path_util_test.cc: const string kExpected = "/test.png";
./unix/ibus/mozc_engine.cc:const char kMozcToolIconPath[] = "unknown.ico";
./gui/about_dialog/about_dialog.cc: product_image_.reset(new QImage(":/product_logo.png"));
./gui/about_dialog/version_image_widget.cc: pixmap_.reset(new QPixmap(":/update_uptodate.png"));

173:login:Penguin
10/05/29 05:05:05 HpwUbVkD
Qtの依存性はとってほしいのう

174:login:Penguin
10/05/29 05:55:26 AyL6o9sV
っぽい?
URLリンク(gazo.pandoravote.net)

175:login:Penguin
10/05/29 06:02:32 AyL6o9sV
アイコンファイル名まとめ

・エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
・ツールアイコン /usr/share/ibus-mozc/unknown.ico
・なにやら用途不明 update_uptodate.png test.png

ファイル形式はとりあえず、png svg など?

176:login:Penguin
10/05/29 07:17:39 BVlp1Ywh
>>174
アイコンはmozc iconsとかで画像でググると・・・・
(gogle以外から取るのが憚れるのなら、本来linuxでは使えない本家をダウンロードしようとしてキャンセルすると右側に・・・)
ツールアイコンは、seahorceのアイコンを使えば・・・

177:login:Penguin
10/05/29 07:21:55 BVlp1Ywh
>>176
ごめん
ツールアイコンは>>171使えばいいのか

178:login:Penguin
10/05/29 07:36:25 BVlp1Ywh
ツールの方はうまくいったけど、product_logo.pngがうまくいかない。

179:login:Penguin
10/05/29 07:47:20 AyL6o9sV
ロゴは>>95に貼ってあるよ

180:login:Penguin
10/05/29 07:52:21 BVlp1Ywh
>>179
それを使ってるんだが、うまくいかない。
32ピクセルじゃないと駄目なのかなと思って、変換したんだけど、変換しても駐車禁止マークのままだorz

181:login:Penguin
10/05/29 08:13:57 AyL6o9sV
あ、ごめんなさい>>175間違ってる
×エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
○エンジンロゴアイコン /usr/share/ibus-mozc/product_icon.png

182:login:Penguin
10/05/29 08:18:55 BVlp1Ywh
>>175
const char kEngineDescription[] = "Mozc Japanese input method";
const char kEngineIcon[] = "product_icon.png";
const char kEngineLanguage[] = "ja";


product_logoじゃなくてproduct_icon>>172じゃないか
いけた!



183:login:Penguin
10/05/29 08:21:57 BVlp1Ywh
をを!情報の所のアイコンも歯車から>>95のアイコンになってるよ。
thx!

184:login:Penguin
10/05/29 14:43:55 owr+HVq8
おもしろそうだけど
こりゃ、まだ手を出すには早そうだw

185:login:Penguin
10/05/29 15:14:57 yDWgz2cr
>>169
> uim-mozcって、変換前入力中のカーソルの左右移動がおかしくない?
> 「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。

これ直った。中の人ありがとう。

186:login:Penguin
10/05/29 16:13:55 BVlp1Ywh
URLリンク(www.geocities.jp)
ここの人名辞書と、追加名詞辞書、郵便番号辞書を書いてある通りに辞書書き換えてからビルドすると、google日本語入力と遜色ないね。
アイコンも表示させちゃったし満足。

187:login:Penguin
10/05/29 16:24:48 Wy6TIjrt
>>186
ところがまだ当分、アップデートはおおいんじゃない?めんどくさそうだよ。

188:login:Penguin
10/05/29 16:50:31 BVlp1Ywh
>>187
そのうち各ディストリビューションで標準で使えるようになるでしょう。
Chromiumブラウザも最初は酷いもんだったし、それと同じ様に完成していく過程を楽しめばよい。

189:login:Penguin
10/05/29 18:47:37 WFFijhq6
>186-187
ユーザー辞書にインポートすればok。
186のURLから入手できる辞書ファイルは、ユーザー辞書用とはデータのパターンが違うが、
書き換えればいける。
個人的にはAnthyで作ってたユーザ辞書を変換してmozcで使えるようにしたから、
完全に乗換ちゃった。

190:login:Penguin
10/05/29 19:15:21 ZqFe9xLl
>>189
ユーザー辞書にインポート

辞書が更新

さらにインポート

重複した単語が増えて無意味に辞書が膨れ上がる

と、ならないか?

191:login:Penguin
10/05/29 19:30:12 yDWgz2cr
あるかもしれんけど、mozcが辞書に本格的に手を入れることはあるのか。
あるとしても当分先なのでは。

192:login:Penguin
10/05/29 19:47:39 3OqiOhkT
どれ位なら本格的と言えるかわからないが
この間の更新では7万語ほど追加された

193:login:Penguin
10/05/29 21:17:05 yDWgz2cr
>>192
まじで? そういうの Commit Log に残らないのかな?
7万語ものdiff見せられても困るけど。

194:189
10/05/29 22:43:57 WFFijhq6
>190
重複することは考えてなかったけれど、重複はしてるんでしょうね。
ただ、実際に使っていて、気にはならないよ。
むしろ、今まで育ててきた辞書に登録してある単語が変換できなくなる方が困る。
辞書が脹れ上がったばあい、何が問題になるの?


195:189
10/05/29 22:57:54 WFFijhq6
>190
~/.mozc にあるユーザー辞書へのインポートだから、mozc本体をアップデートしても
再インポートにはならないです。

196:login:Penguin
10/05/29 23:10:09 yDWgz2cr
ちょっと調べてみたが、すでに重複が存在する。
例えば、
$ grep "ILO条約" *.txt
dictionary1.txt:あいえるおーじょうやく 2310 2239 7323 ILO条約
mozc-meisi-20100516ut.txt:あいえるおーじょうやく 2239 2239 14771 ILO条約

ついでに、UITUMIさんの辞書自身の内部にも重複があったりした。
例えば、
$ grep "0741273.*北海道深川市音江町" *.txt
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町

読みと漢字は同じだが、真ん中の数字が違うのがオリジナルの辞書にあったりするから、
正確な重複数までは確認できてない。

197:login:Penguin
10/05/29 23:16:18 yDWgz2cr
>>194
> 辞書が脹れ上がったばあい、何が問題になるの?

その程度次第だけど、重複していることがわかると、
「どのくらい重複しているのか」
「果たしてこの追加辞書にどれだけの追加する価値があるのか」
とかいろいろ気になってしまう。

198:login:Penguin
10/05/29 23:54:45 yDWgz2cr
オリジナルの辞書に「赤木リツコ」や「涼宮ハルヒ」はあんのに「磯山さやか」がないのはどう言うことだ?
納得できんな。

199:login:Penguin
10/05/30 00:17:22 72nIDqZ2
>>186
あとユーザー辞書でベクターにあったカタカナ語辞書入れてみたらいい感じだな。
Book Offはあるのにbookがないとかはまああるけど。

200:login:Penguin
10/05/30 00:24:14 ctRryZlG
mozc-jinmei-20100517ut.txt とオリジナル辞書との重複
3357 / 105793 (約3%)

mozc-meisi-20100516ut.txt とオリジナル辞書との重複
8452 / 96378 (約9%)

201:login:Penguin
10/05/30 00:34:41 AWGjLpyv
もずく

202:login:Penguin
10/05/30 01:00:44 ysTkCy8z
UTUMIさんの辞書が更新されているね。

203:login:Penguin
10/05/30 01:50:49 ctRryZlG
>>202
付属辞書を全部置き換えるとか言われるとちょっと躊躇しちゃうなあ。
付属辞書が今後更新されたときどうすべきか悩む。

204:login:Penguin
10/05/30 02:06:32 SVG1hTFg
mozcプロジェクトに辞書をコミットしちゃえばいいような

205:login:Penguin
10/05/30 07:33:37 nCq3cr+o
あと、ダウンロード元だと、5/28じゃなくて5/30版になってるけど、それはいいとして
apply-mozcdic-ut.shが

#! /bin/sh

cat mozcdic-ut-*.txt edict-katakanago/mozcdic-ut-*.txt ../data/dictionary/dictionary1.txt > dictionary1.txt.new
cp -f dictionary1.txt.new ../data/dictionary/dictionary1.txt

になってるので、展開した ~/src/mozcdic-ut-20100530からみて、位置が異なるので、
../data/dictionaryの部分を../mozc/src/data/dictionaryのように書き換えてから実行するといいと思う。


206:login:Penguin
10/05/30 08:20:01 nCq3cr+o
>>205
ごめん、~/src/mozc/srcに展開すればいいだけの話だね。

207:login:Penguin
10/05/30 09:27:18 /q37kFvx
普通に端末からcat実行すれば良いのでは?

208:login:Penguin
10/05/30 09:35:37 nCq3cr+o
>>207
コマンド書いてあるだけだから、それもありだね。

209:login:Penguin
10/05/30 09:38:04 nCq3cr+o
あいぱっどを変換するとipodが出てくるんだが、どの辞書の間違いだ?

210:login:Penguin
10/05/30 10:50:29 YvZiFHSE
dictionary1.txt:あいぱっど 2239 2239 7203 ipod
Googleの辞書っぽい

211:login:Penguin
10/05/30 17:07:00 72nIDqZ2
ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う?
最長一致とかの方式だと文節変えないと出ないとかあるけど、
mozcで出ない場合はむしろ基本単語に漏れや頻度データの間違いがあるだけな気がする。

特定熟語が頻出すぎてそれ以外の組み合わせの頻度が低いと、それが辞書から落ちて
変換できなくなってるケースがあるんじゃない?

212:login:Penguin
10/05/30 17:29:24 uJai2QSu
やっとmozc入れたけど、辞書登録のバーが出て来ないんだけどなぜだ?
ちなみに、
$ /usr/lib/mozc/mozc_tool --mode=dictionary_tool
とコマンドで打てばあるので、辞書登録はできるっぽいです。
バーを出すにはなんかやる必要があるのでしょうか?

ちなみに、憩いの場さんのとこのリポジトリから9.10のをとりました。



213:login:Penguin
10/05/30 17:34:15 IJqAauuC
>>212
「iBusの設定」の言語パネルの表示が表示しないになってるんじゃね

214:login:Penguin
10/05/30 17:38:32 ctRryZlG
>>211
> ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う?

もしかしてUTSUMIさんの私家版辞書のこと言ってるなら、もう削ってないよ。

215:login:Penguin
10/05/30 17:59:01 uJai2QSu
>>213
iBusの設定のそれは「when active」になってます。

入力時のバーが
[mozc|あ|☆]
しか出てなくて、調べてみると本家は
[mozc|あ|@|☆]
と、@のところに、propertyやらdictionaryがあるみたいなんです。

216:login:Penguin
10/05/30 18:20:19 nCq3cr+o
>>215
憩いの場氏の使ってるんだったら、前バージョンのは非公式なツールが悪さしてるんじゃないかな?
鍛えた辞書が勿体ないが、~/.mozcを消してみるといいのかも。


217:login:Penguin
10/05/30 18:24:09 /q37kFvx
>>215
自前ビルドしてみると幸せになるかも。

218:login:Penguin
10/05/30 18:33:14 RB6LrfSr
最新ビルドの辞書バーのアイコンが重複してるのは既出か…。

219:login:Penguin
10/05/30 19:12:32 uJai2QSu
>>216
.mozcを消しでみましたがかわりませんでした。

>>217
ビルドはちょっと…
もう一つのパソがビルドでうまくごちゃごちゃになってしまったので、こっちは憩いの場さんに頼らせていだだいたというわけです。

220:login:Penguin
10/05/30 22:53:10 XBBIE1D1
mozcってnew BSDライセンスなのにCopyrightがgoogleになってていいのか?
chromiumはBSDライセンス(3-clause)でubuntu ppaのCopyrightはChromium Authorsになってる。
ようしらんけどppaのはわざわざCopyrightをChromium Authorsにかえてるのかそうでないのか。
あるいはmozcもgoogle以外のコードが入った時点でCopyrightを変えるのか。
ま、わりとどうでもいいけど。

221:login:Penguin
10/05/31 03:17:09 OxheF7AP
>>219
バージョンは0.11.365.102となってる?
一度synapticでmozcとなのつくもの全てアンインストールして入れなおしてみたら?


222:login:Penguin
10/05/31 03:20:02 OxheF7AP
>>219
sudo apt-get remove mozc-server mozc-utils-gui ibus-mozc
sudo apt-get update
sudo apt-get install mozc-server mozc-utils-gui ibus-mozc

223:login:Penguin
10/05/31 03:27:36 u2z9heZ1
PPAにMOZC置いた人って信用出来る?
もう面倒なのでこれでいれちゃうよ?

224:login:Penguin
10/05/31 07:43:28 XQ2ccCmp
うちのとこ(9.10)も設定ツールが言語バーに出ないな。
再インストールしても同じ。

225:login:Penguin
10/05/31 08:54:01 4NQTaTq8
>>223
信用できないから自分でビルド
憩いの場のSawa氏のリポジトリも、Modified Anthyに変わるということで、
>勝手に変えるなバカヤロー、という人は使わないでください
と言ってるので自分でビルド




226:login:Penguin
10/05/31 11:17:54 7jMwOMF4
PPA は 鯖側がビルドするので、鯖がクラックでもされない限り、バイナリパッケージの中身は
担保される。
元ソースと差分も表示されるので、野良ビルドと比べて比較にならないほど安心できる。

227:login:Penguin
10/05/31 16:14:30 FTkWWhkF
>>226
PPAも野良と同じだろ
PPAもその辺のユーザが作っていて、他のと変わりないと思うが?
まともにメンテされてないパッケージの多いこと多いこと
GPG署名が入ってれば改変されているか分かるし。
違いはdiffの提供ぐらいか

228:login:Penguin
10/05/31 16:38:48 wf2jYEJD
mozc入れてみたけど全然ダメだ
preeditテキストが表示されない
ほんまにテストしてリリースしてんのか?

229:login:Penguin
10/05/31 17:04:45 HeOjte/K
>>219
qt4関連入ってんの?

230:login:Penguin
10/05/31 18:38:45 1o5Z8GAq
>>228
buildにつかったlibibus-devのバージョンがmozcで使うibusのバージョンより
古いとpre editが表示されなかった
だからdebian sid(ibus 1.3.x)相当の環境でubuntu 10.04(ibus 1.2.x)でbuild
されたパッケージ使おうとするとそういうこと起こるかも

自分でbulidしてだめだったら分からんが

231:login:Penguin
10/05/31 21:18:42 Ol5eUFST
UTSUMIさんの辞書が更新された。
で、それと知らず使ってる人が誤解するのを危惧してる。

232:login:Penguin
10/05/31 21:20:46 Ol5eUFST
いや違う、辞書は更新されてないか。
SF.netのフィードの配信遅すぎ。

233:login:Penguin
10/05/31 22:27:56 G2NqXecX
mozcのプロパティの一般タブで
候補選択ショートカット を A-Lにしても
候補表示窓では1-9になっちゃってるね。
実質A-Lは使えないみたい。

234:login:Penguin
10/05/31 23:53:43 HhhYtfRc
219です。
昨日はいろいろと、mozc関連のファイル消したりしましたがダメでした。(もちろん0.11.365.102です)

>>229
qt関連は入っておりません。
mozcの設定に関して重要なのでしょうか?


texが使えないので10.04には当分のあいだ手を出せません…

235:login:Penguin
10/05/31 23:57:49 4NQTaTq8
>>234
Sawa氏のやめて自分でビルドして入れろ。

236:login:Penguin
10/06/01 08:58:36 Khp/NcXq
>>226
鯖というより、パッケージングしてる人かな?
パッケージングしてる人が複数いるようだけど、ばらばらにやるのではなくチームとしてやってくれるといいんだけど。
それまでは素性のわからんやつのPPAは躊躇する。

237:login:Penguin
10/06/01 09:22:43 Khp/NcXq
某はてなのブログにコメントしてる人
ブロガーの義務でもなんでもないのに、UTSUMI氏の辞書入りPPAを紹介して、UTSUMIに迷惑かけなきゃいいけど。

238:login:Penguin
10/06/01 09:24:13 Khp/NcXq
>>237
最後の敬称が抜けてた。
UTUMIに迷惑かけなきゃ→UTSUMI氏に迷惑かけなきゃ

239:login:Penguin
10/06/01 12:43:06 4zExM02R
>>236
自分でビルドするから楽しいんだろうが。
自分でやれ。

240:login:Penguin
10/06/01 12:53:30 XI8koRaq
>>237
そこまで書くなら url書けよ。


241:login:Penguin
10/06/01 13:34:08 Khp/NcXq
>>239
だから自分でビルドしてると言ってるじゃん。
>>240
書こうと思ったけど、ブログ主に迷惑掛かると思ったからやめた。
そのくらいggrks

242:login:Penguin
10/06/01 13:35:45 Khp/NcXq
ごめん。ID変わってた。
>>235もおれな。

243:login:Penguin
10/06/01 13:41:31 XI8koRaq
>>241
だったら、ブログへの愚痴をここに書くなよ。
わけわからん。

244:login:Penguin
10/06/01 13:55:12 Khp/NcXq
>>243
一般論として捉えればいいこと。
例えば、Sawa氏が、UTUMI氏の趣旨を理解して辞書を同梱したとして、ホームページにその旨を書いたとしても
それを紹介する第三者が、単にリンクとか手順だけ紹介したら意味はない。
これはたとえ話なので、はてなのブログの話はSawa氏のリポジトリのことではないが、趣旨はそういうこと。

245:login:Penguin
10/06/01 14:42:35 XI8koRaq
>>244
? かなり自己中だとおもう。

246:login:Penguin
10/06/01 16:16:29 0n41Qhbr
Googleの人自身が追加辞書に否定的だからなあ。

URLリンク(twitter.com)
通常どんなIMEでもデフォルト状態が一番性能が高いように設計されています。
はてな辞書などをデフォルトで有効にしていいものをしていないのは、
精度が下がるからです。
手元で実験していますが基本デフォルト状態が一番良くて
ユーザ辞書でもなんでも余計な物を突っ込むと精度が落ちます。
6:13 PM May 30th webから

ただ文章表現って多様だから、
とあるケースでの精度がいかに良くても、
ある人にとっては全体としてイマイチだったりすることもある。
「基本デフォルト状態が一番性能が高い」とはちょっと思い上がりかもなあ。
ちょっと前まで県名を変換できなかった完成度だし、
はてな辞書にしても、単純に全部足したら精度は落ちるけど、
選別したうえで必要なものを足せばそれなりに使える。
なによりGoogleの秘密版の辞書って余計なものの盛り合わせじゃね?

辞書は色々あっていいと思う。ハッカーにしてみればうぜーのかもしれないが。
ただ今はバグ出しとか必要なので、デフォルトで使ってみるのも大事。
ディストリ標準で非公式辞書を最初から埋め込むのはまだ早い。
メーリングリストで注意喚起したって見てるやつほとんどいねえしな。
アイコンがないのも現状の完成度を暗示してると思うので、
あえて足すことはない。

あ関係ないけどHideaki ABEさんmozc-configの開発お疲れ様でした。
公式版はQt依存めんどくせえのでちょろっと使わせていただくかもしれません。
ABEさん自身が使ってるのであればフリーズすることもないのでは。
それとGoogleのひとIssues報告放置しすぎ(出張中か?)

247:login:Penguin
10/06/01 16:23:50 Khp/NcXq
>>245
は?なにが?

248:login:Penguin
10/06/01 16:31:12 XI8koRaq
>>246
辞書の育成はセンスもあるからな。
作者が最適化している辞書だとしても
それより優れたものは現れるかもしれない。チューニングする人しだいだね。
ま、遺伝的アルゴリズムみたいなもんだからね。
良いセンスの人がチューニングした辞書がオープンソースとして公開されたら
たすかるからね。

249:login:Penguin
10/06/01 16:34:29 Khp/NcXq
それはそれ
ID:XI8koRaqみたいなアホが知らずにgoogleとは違う辞書を使ってフィードバックするようなことがあれば、迷惑な話。

250:login:Penguin
10/06/01 17:17:22 X3cZthyj
>>246
そもそもデフォルト状態って、大規模コーパス版のことだろ。
エンジンの設計が同じならIPADic使ってる時点で性能落ちてるんじゃないか?
そこから追加した微妙な部分が付属辞書にあってそれが肝だってことなら、
どういう方針で調整がなされたのか誰か差分取って調べてくれないかな?

ユーザー辞書は登録時に頻度情報が入れられないので変換精度が落ちるに決まってるじゃん
組み込み追加辞書の場合は頻度情報入ってるから全然違うと思うけど。
しかしその頻度情報の精度というのが母集団、つまりコーパスデータによるから
まんべんなく集めてるグーグルより桁が落ちるかもとか、統計学的にデータまぜるなきけん、
って話なだけでしょ。

結局、GPSのわざと下げられている精度をどうやって向上させるかみたいな話なんだから、
中の人なら否定するに決まってる。


251:login:Penguin
10/06/01 17:19:24 +xUAPRzh
GPSの軍用コードはすべてにおいて民間用を超えるわけではないらしいけど
戦時に精度低下があれば補正値知ってると良いかもしれないけど

252:login:Penguin
10/06/01 17:22:17 6lXEiumK
午後を入力するのに、「ご」と「ご」を区切るなよ

253:login:Penguin
10/06/01 17:39:27 XI8koRaq
>>249
粘着お断りです。ごめんね。

254:login:Penguin
10/06/01 18:15:44 Khp/NcXq
ID:XI8koRaq

255:login:Penguin
10/06/01 18:28:50 0n41Qhbr
>>246
> そもそもデフォルト状態って、大規模コーパス版のことだろ。

そうなのかな?
Google辞書だったら開発者が意図しようがしまいが、
「はてな辞書」の語彙は収集されて有効になってると思う。
まあ直接聞かないと分からんが

256:login:Penguin
10/06/01 18:29:31 0n41Qhbr
>>250 だった

257:login:Penguin
10/06/01 18:55:15 X3cZthyj
>>255
追加単語そのものより、漏れが出る事が問題な気がする。
>>252とかもそうでしょ。

258:login:Penguin
10/06/01 19:24:49 XI8koRaq
ごご か。 変換してないな。
英英辞典とか そのへんの言葉が漏れてたりもするし、
いまはこまめに辞書を育てるしかないなぁ。とはおもってるよ。
それでもanthyよりは使い易いけど、


259:login:Penguin
10/06/01 19:40:59 iRw/MYCq
辞書の問題っていちいちバグトラッカーにあげることになんの?
いちいちめんどくさいよね。

「はりつけて」で「貼り付けて」がでない。

260:login:Penguin
10/06/01 19:47:12 biQ6ox7/
そういうのは鍛えりゃいいだけだよな

261:login:Penguin
10/06/01 19:53:01 iRw/MYCq
>>260
そんなこと言い出したら何でもそうじゃん。

UTSUMIさんの名詞辞書をもってしても「ポルチオ」がないのはしょうがないかなとは思うが。

262:login:Penguin
10/06/01 20:01:56 biQ6ox7/
Anthyのデフォルト状態とかひどいもんだからな

263:login:Penguin
10/06/01 20:26:01 2EYeyyHj
ライフサイエンス辞書が登録できるようにしてくれ
あれがないと話にならん

264:login:Penguin
10/06/02 00:05:59 qoQj5wV4
誰かフォークするものはおらんのか!
誰か!

265:login:Penguin
10/06/02 01:29:17 HiSOFHLt
>>244
そういう話を当のブログにコメントで書いてあげたら?
URL 書けないならそれができるのは君しかいないんだから。

266:login:Penguin
10/06/02 01:40:28 408ZUOE4
とりあえずSKKのスモール辞書辺りの単語は網羅されているのか比較してみた人居る?
っていうか>>200のツール教えて欲しいな。

267:200
10/06/02 02:05:04 w3pItDF+
>>266
辞書ファイルの読みと漢字だけを sed で抽出して sort -u したものを、
sort -m して uniq -d して wc -l しただけ。だったはず。
ていうか、細かいこともうすっかり忘れてて愕然としている俺がいる。

268:login:Penguin
10/06/02 02:33:17 nCOjwefR
>>263
Google日本語入力、ATOKやことえり辞書のインポートに対応
URLリンク(internet.watch.impress.co.jp)
Google IME/Mozcのユーザ辞書は同じ形式のはずだから、
Windowsで何とかインポートしてLinuxに持っていけば使えるはず。
LSD(なんつう名前だ)はMS-IMEシステム辞書形式だから、
バイナリエディタでいじらないとインポートできないかもな。

>>266
meisiは0601では重複ないはず。
jinmeiは重複チェックしてないはず。
同じのをModified Anthyでも使ってるから。
の割には重複少ないな。
まあ収録数多いから比率的に小さくなるか。

> SKKのスモール辞書辺りの単語は網羅されているのか比較
くだらねー。
それに単に網羅したって意味ないよ。
要らない単語削って頻度指定して…とやらないとな。
ためしにユーザ辞書として一律にインポートしてみれば。

しかしこんな「要望」によく応えたもんだよ。「当然のこと」とか「絶対対応するべき!」とか。
日本のLinuxユーザのレベルを示したスレ↓。
> Linuxユーザーにこそ必要なものです。
URLリンク(www.google.com)

> Linuxユーザは共同でプロジェクトをより良いモノに完成させたい意識は
> マックやWindowsのユーザよりも高く、
経験的にはWindowsユーザのほうが人数多いぶん反響あるし、
より良くしたいという人も多いんじゃねえかなー

269:login:Penguin
10/06/02 03:07:20 HDGBUJC9
>>268
そりゃ単純に母数が大きいだけじゃないか?
Linuxは開発コミュニティへの貢献意識が強いユーザが多いというより
そういう人間しかLinuxを使ってないという側面がある

270:login:Penguin
10/06/02 03:26:40 fMpvOFIK
>>269
> そういう人間しかLinuxを使ってないという側面がある
それはないわ

271:login:Penguin
10/06/02 03:32:32 7kI2YFS9
>>268
LSDは確かことえり形式の辞書がダウンロードできたはず。
ちなみに名前はあえてそういうのを狙ったんだとさ。

272:login:Penguin
10/06/02 06:43:02 02i5Uj0J
>>265
コメントしましたがなにか?
きみに言われる筋合いはない。

273:login:Penguin
10/06/02 06:46:10 02i5Uj0J
>>268
で、Google側は辞書の提供はなく、ユーザ側は辞書よこせだったわけだw
もうアホかと。

274:login:Penguin
10/06/02 07:10:05 5crcoY3W
>>268
> しかしこんな「要望」によく応えたもんだよ。…

そりゃ 戦略上のことをいうとgoogleって自社osつくるんだし
日本での普及を考えたらimeは無視できないのは当然かと。
web tvがどんなことになるのかわからないけど、こっちでも
重要な役割でしょうしね。
また、脱msのものを普及させようと思ったらこの辺の周辺のことって
無視できないからね。
だから、答えたとしても利益があるんだろうね。

まるでウインドウズユーザーのような連中の声って、その辺を
機敏に感じるにはよいのかもね。

ないものは作れという思想のもとでlinuxを利用しているものから見れば
苦笑いの連中だけど、それだけ昔よりは普及してきているという証でも
あるんだろうね。彼らを蔑んでみるのはわからんでもないけどね。

275:login:Penguin
10/06/02 10:03:44 HiSOFHLt
>>272
ならいいけど。
「なにか」とか言われても URL わからないから
コメントしたかどうかおれにはわからなかったよ。

276:login:Penguin
10/06/02 14:43:48 SuZRONSu
何の話をしてるかわからなかったが
URLリンク(linux.ikoinoba.net)
のことを言っているのか
ここの「またまた帰ってきた某所の匿名」と「ID:Khp/NcXq」は同一人物だろう
「某はてなのブログ」がどこかはわからなかった

277:login:Penguin
10/06/02 15:02:37 02i5Uj0J
>>276
某はてなはそこではない。

278:login:Penguin
10/06/02 15:40:49 SVlKWBuX
Linux界隈でバイナリ配布禁止をはじめて見た

279:login:Penguin
10/06/02 15:44:09 HiSOFHLt
>>278
禁止はしてないでしょ。

280:login:Penguin
10/06/02 16:32:49 SVlKWBuX
禁止と言っているようなものだろ
これで配布したら

作者の気持ちを考えないなんてサイテー

と喚く馬鹿が大量発生する

281:login:Penguin
10/06/02 16:51:06 KEng9W8y
ていうかnon-freeぐらい珍しくもないだろ

282:login:Penguin
10/06/02 16:57:43 5crcoY3W
ライセンスを発行した上でライセンス以外のお願いをするというのは
あまり褒められたものではないとは思うよ。

ありとかなしじゃなくて記述しているかしてないかだけが意味するのにね。
ライセンスってそうゆうもんだって理解してたんだが。

鬼車のrubyマージ騒動みたいになっちゃうよ。

283:login:Penguin
10/06/02 17:00:56 1sMEC1wh
他人のライセンスを制約するならともかく
自身の著作物にコメントするのは何も問題ない

284:login:Penguin
10/06/02 17:04:19 5crcoY3W
>>283
うん。そこをトラブルしないために、自分の著作物に新たなライセンスを加えて
しまえばいいというのは当然だとおもうよ。加えないのに別のお願いをする場合
そのライセンスと矛盾するならば当然作者に問題があるし、矛盾しないならば
なんのトラブルもならないだろう。

285:login:Penguin
10/06/02 17:19:02 QoktT3oR
まあ、よくないわな。しこりが残る

Google曰く「Mozcのバイナリ配布は避けてください」

286:login:Penguin
10/06/02 17:22:49 02i5Uj0J
バイナリをわければ済む話。


287:login:Penguin
10/06/02 17:40:27 nCOjwefR
>>280
ソースパッケージに突っ込むのは勝手だけど、
有効にするのは各自でビルドオプション付けてねってことでしょ。
「意識的に」各自でやってもらわないと、
Googleにワケの分からないことを報告するバカが大量発生するから。
何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

Googleにしてみればこう。
ユーザ「Mozc最高だぜ」
Google「(うんうん)」
ユーザ「人名xxxxもアレな名詞xxxxも出てくるぜ」
Google「(ん???)」
Google発表「基本的にはデフォルトで使うのが一番精度が高いのであります」

それに非公式辞書追加を知らずして
「Googleさん辞書追加ありがとー!!」とか言われても、
Googleも辞書作者も甲斐がないだろ?

>>278
debianだと2ch辞書を選択制にしたりとか、
gentooだとmplayerとか?のビルドオプション選ばせたりとか。
「各自で意識的に選んでね」というのはよくある方式よ。
文句あるなら選択ダイアログ出せばいいじゃん。
辞書がアドオン形式ならパッケージ名で明確に分割できるけど、
Mozcは全部一体だからしょうがない。

バイナリ禁止自体は昔LAMEで見たような気がする

288:login:Penguin
10/06/02 17:51:17 02i5Uj0J
>>287
Anthyよりmozcの方が変換精度が高いとか言ってるやつらはみんなそれだよな。
同じ辞書を追加した状態でのAnthyとmozcは大差ないだろ。

289:login:Penguin
10/06/02 18:01:18 grruSKdq
LAMEのバイナリ配布は特許にひっかかる恐れがあるからではなかったかと。
今回の問題とは若干違うような。

>「意識的に」各自でやってもらわないと、
>Googleにワケの分からないことを報告するバカが大量発生するから。
>何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。

これはほぼ同意。

290:login:Penguin
10/06/02 18:02:11 nCOjwefR
まあどうしてもバイナリ配布したくて(各自でビルドすりゃいいことだと思うけど)、
非公式版であることをハッキリさせたいのであれば、
デフォルトのバイナリパッケージ+差分パッチぐらいか?
パッチで非公式バイナリを意識的に「再現」させるという形。

しかし自分好みにしたいんだったら自分でビルドくらいは当たり前じゃねえの?
それに辞書作者の意向つうかMozcプロジェクトの現状レベル考えたら、
今はデフォルト状態でテストしたほうがいい。
原作者が「余計な辞書入れたら精度下がる」つってんだしさ

291:login:Penguin
10/06/02 18:50:57 9TUUxqr0
バイナリ配布が基本的に禁止というと思い出すのがかつてのqmail。

292:login:Penguin
10/06/02 19:06:18 /GEmtGf2
>>289-290
辞書作者もそう思ってるだろうが、
それならなんでバイナリ配布OKのライセンスで配布するのか分からない

293:login:Penguin
10/06/02 19:26:14 O5aiTgdT
ぶっちゃけリポジトリを公開したら、webの注意書きなんて読むような
聞き分けのいい人じゃなくてタコ以外使うわけないだろ。
特にubuntuなんでデフォルトで対応しているのに、作っておきながら
組み込んでますなんて意味不明だ。
しかも、バグ報告は送るなといってるけど、じゃあ誰に送るんだ?
お前が引き受けろよ、そうでなければ公開すべきじゃない。

294:login:Penguin
10/06/02 19:29:49 1sMEC1wh
>>292
もとはModifiedAnthy向けに公開されていた辞書だから
Mozc用に改めてライセンスをいじっても仕方ない

295:login:Penguin
10/06/02 19:37:51 CGmWTyeQ
>>293
誰に言っているのか知らないが、俺のubuntuで
apt-get install ibus-mozc
とやってもインストールできない。本当にデフォルトで対応してるの?

296:login:Penguin
10/06/02 19:44:23 x5YErinu
>>293
日本語が不自由な人のような

297:login:Penguin
10/06/02 20:00:24 OEd5PW/N
>>293
すまん、意味不明すぎて何をいってるのかさっぱりわからん。

298:login:Penguin
10/06/02 20:00:48 9DErp56Y
>>295
Currently, we only support Ubuntu 9.10 and 10.04 for building Mozc.
URLリンク(code.google.com)

299:login:Penguin
10/06/02 20:02:49 t70gHhyq
>>295
リポジトリは加えなくてはダメ
加えても性能のいいModifiedAnthyは使うなといわれた
初心者にはibus-mozicの魅力が薄れた

いまここ

300:login:Penguin
10/06/02 20:04:18 L1cbISCc
anthyがいいとか言ってる池沼レベルの人間がまだいるんだな

301:login:Penguin
10/06/02 20:07:31 w3pItDF+
>>288 とかもね。

302:login:Penguin
10/06/02 20:08:54 fe2DcE2M
人それぞれさ、お気に入りのを使えば良いだけ

303:login:Penguin
10/06/02 20:17:47 RpWCZxYd
Google -IMEって変換エンジンはVJEの流用だったっけ?

304:login:Penguin
10/06/02 20:41:06 HiSOFHLt
>>303
そんな話どこで読んだの?

305:login:Penguin
10/06/02 20:48:51 408ZUOE4
>>267
ども、UNIX的手法だったんですね。全然身についてないなあこういう即席データ処理。

>>268
>> SKKのスモール辞書辺りの単語は網羅されているのか比較
>くだらねー。
>それに単に網羅したって意味ないよ。
>要らない単語削って頻度指定して…とやらないとな。
>ためしにユーザ辞書として一律にインポートしてみれば。

なにが言いたいのかさっぱりです。
デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
その場合の追加辞書という意味では、まあ確かに意味が無いですが、
判断の為の辞書内容の分析が下らないというのは意味不明です。

抜けている単語を抽出して、それが本当に変換出来ないのか確認してみるのは、
やみくもに探したり、ひたすらバグ報告を待つより早いのでは?


306:login:Penguin
10/06/02 21:22:35 408ZUOE4
>>287
そもそも、純正版と改造版を共存できるようにしたほうがわかり易いんじゃないですかね?
ビルドしない人にとっては意識できないままで、単純に退化したとしか思わないでしょうし。

307:login:Penguin
10/06/02 21:31:19 RpWCZxYd
>>304
あー、ごめん、VJE使ってるのはYahoo!の方だったわ。

308:login:Penguin
10/06/02 21:35:29 408ZUOE4
Google SONY連合ということで、mozcにsj3を合体させたらなにができるんだろうか?

309:login:Penguin
10/06/02 21:58:00 nCOjwefR
>>305
だからさ、やってみりゃいいじゃん。
S辞書とMozcデフォルト辞書の差分だろ?

SKK辞書は動詞の形式が特殊だから、
単純に比較できるのは名詞系だけかもな。

> デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
網羅してるかどうか分からんのでしょ?
試しにやってみて動作を確認すればと言ったわけよ。
Mozcのユーザ辞書のシステム辞書に対する優先度は知らないんだけど、
「漏れてる」と判断された短い単語がたくさんあれば、
おかしな変換結果が大量に発生して、
単純差分じゃ意味がないことがすぐに分かると思ったから。
実際どうなるかは俺も知らん。

Mozcのデフォルト辞書は長年編集されてきて収録数も膨大なIPAdicでしょ?
> SKKのスモール辞書辺りの単語は網羅されているのか比較
こんな発想おれにはないよ。「スモール」辞書と比較?
バカだなあ、と思いつつも、
>>305が意外な発見をして本家に有益な貢献をするのかもなあ

310:login:Penguin
10/06/02 22:35:24 nCOjwefR
>>305
とりあえずやってみた。
雑にやったものだからソースとかは出さねえよ。
確認したのは「存在しない表記」だけな。読みは無視。

SKK-Sには重複除いて4581の表記がある。
このうち単漢字・アルファベット・記号以外で
Mozcデフォルト辞書に入っていないのは次の通り。

仮名漢字変換
全角仮名
半角仮名
半角片仮名
日帰
最寄
相変
見掛
見落
記事選択

以上。
単漢字は自分で探してくれ。
記事選択とかは分けて変換できると思うので、
全部網羅されてると言っていい。

じゃあな

311:login:Penguin
10/06/02 22:41:13 408ZUOE4
>>309
詳しいやり方がわかりませんので、簡単にできるなら是非どうぞ。

とりあえず茶筅やメカブの辞書をgrepして眺めているだけですが、
IPAdicはあくまで形態素のコーパスで、熟語は音声処理用かなんかの逆変換で使いにくい
短い単語とかは結構足りないんじゃないかって気がします。
例えば宮城県で探しても大学の名前しかでてこなくて県名単体すら入ってない。
Mozcの辞書も傾向は似ていますが、unicodeな単語とかも入ってて
多少改善してる感じは気のせいでしょうか?

312:login:Penguin
10/06/02 23:00:23 408ZUOE4
っと入れ違いでした
>>310
どうもです。とりあえず予想通りって事ですよね。
単漢字の漏れというのはどうなんですかね?
まあ扱いは難しそうですが。

313:login:Penguin
10/06/03 00:50:31 0C19uf7w
>>311
なにがしたいのか意味が分からないのだけど
「宮城」「県」が入っていれば
「宮城県」は変換できる。
というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
ディスクの無駄だし。
短い単位で解析できるように、というのが UniDic。
自分でクロールしてきたデータに UniDic の MeCab をかけてコーパス作ればいいんじゃないかな

314:login:Penguin
10/06/03 00:59:29 wmng9tJY
>というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
そもそも大規模コーパスというのはそういう方針とは思えませんが?

パーツの頻度を掛け算した予測頻度を実際の頻度が上回るのであれば登録するべきでしょう。

315:login:Penguin
10/06/03 09:15:19 1uwN98gG
>>300-301
私家版辞書追加して、さすがGoogleって言ってる馬鹿約2名発見しますた。


316:login:Penguin
10/06/03 09:29:34 1uwN98gG
確かに午後と打ちたければ、午と打って後と打てばいいよなwww
それとも午後の紅茶と打って、の紅茶を削るか?w
もうアホかと。

317:login:Penguin
10/06/03 10:29:33 cLHYQIlM
>>42
つきはWakame(ワカメ)だな

318:login:Penguin
10/06/03 11:03:56 yHIg/azl
いやcombだろ

319:login:Penguin
10/06/03 11:43:56 8rrDcIso
libiconvェ…

320:login:Penguin
10/06/03 12:20:21 r9B8lAgG
uim-mozcのビルド方法おしえてくだい

321:login:Penguin
10/06/03 12:38:19 dyOLzhIN
# make; make; make clean


322:login:Penguin
10/06/03 13:37:11 u1itOj+L
>>320
URLリンク(code.google.com)

323:login:Penguin
10/06/03 14:11:44 zicLG5/c
mozcは低能糞ソフトでまともに使えないから、中の辞書だけが欲しいんだよね。

mozcの辞書はどこに置いてあって
どうやってplaintextに変換できるわけ?


324:login:Penguin
10/06/03 15:01:06 bG0s/qhN
糞で低能な奴に「低能糞ソフト」呼ばわりされるmozcとその開発陣は不憫だな。

325:login:Penguin
10/06/03 15:07:37 0C19uf7w
>>314
そうか? 「宮城県」は「宮城」と「県」であって、
「宮城(固有名詞)」の左に来る品詞と「県(接尾辞)」の右に来る品詞は違うのに、
登録してしまうと区別できなくなってしまう。
連接コストまで考えると単語の頻度だけで簡単に決まるものではないので、
なんでもかんでも登録するとむしろ精度悪化することもあるんじゃないかなあ。
(くっつけても品詞が変わらないものはくっつけたものを登録してもいいと思うが)

326:login:Penguin
10/06/03 16:11:34 uFbeO/du
結局、AnthyとMozcってどこが違うの?
Ubuntuで使ってるけど、はじめからあるAnthyよりはMozcの方がよさげだけど

327:login:Penguin
10/06/03 16:30:35 AE+ltDI6
>>326
anthyは開発停止してたんじゃなかったっけ?
mozcは開発公開が始まったばかり。

かなり初期の段階だから、開発協力者だけにしたい状態じゃないかな。
だから、辞書のバイナリうんぬんの話もでる。
stableちかくまで普通は待ったほうがいいだろうね。それでもanthyよりmozcの
ほうがいいように思う。

328:login:Penguin
10/06/03 16:50:09 8XZFMkrD
>>327
> anthyは開発停止してたんじゃなかったっけ?
再開したよ。
URLリンク(sourceforge.jp)

329:login:Penguin
10/06/03 17:30:21 xiIjB+In
>>326
anthyは親指シフトに対応している

330:login:Penguin
10/06/03 18:24:16 u1itOj+L
辞書が同じなら云々言ってる人たちは文節ごとに変換してる人たちでしょ。
文章で変換すれば違いは一目瞭然。

331:login:Penguin
10/06/03 18:26:44 wmng9tJY
>>355
県の後ろにつながるの品詞と、宮城県の後ろにつながる品詞は大差ない。
つまり語頭と語尾の文脈IDを継承すれば済む話。

332:login:Penguin
10/06/03 18:28:03 wmng9tJY
>>325 失礼

333:login:Penguin
10/06/03 19:31:44 HrnMknGo
>>330
筋がいいのはMozcだけど、
IPAdicのせいか文章を細かく区切りすぎるような感じはしてる。
「ご|ご」とか「する|シ」みたいな感じで。
ある程度の長さを入力すれば改善するけど、
やっぱりちょっと細かい感じはするな。
語尾とか複合語の切り方がおかしくなるときがある。

Anthyだとdepgraphだったか語のつながりをある程度まとめてくれるので、
「細かい」って感じはしない。
複合語もcompound.tか何かに大量登録されてるしな。

IPAdicは文章を単語に分割するツールでも使われてるんだっけ。
短い単語に比重がかかりすぎな感じがちょっとする。
複合語を大量追加+短い単語の優先度をちょっと下げる、
くらいの調整はいるかもね。

ちょっと使った感想なんで勘違いかもしれん

334:login:Penguin
10/06/03 19:59:43 AE+ltDI6
>>333

そうだなぁ。検索するときには文章をキーワードにすることはないから、
検索屋さんが作ってるだけに、切り替えみたいなのは欲しいかも。
ibusのプラグインでSKK一発切り替えがあればなぁ。と変態的に思ってる。

mozcの一番良い使い方はおおよそ感じ取れるようになったけど、
やっぱり文節ごとに変換させるのはあまり良くなさそうだな。

335:login:Penguin
10/06/03 20:00:21 eXkP2joF
anthyを頻りに擁護するバカがいついてる模様

336:login:Penguin
10/06/03 20:56:17 0C19uf7w
>>331
あなた中国出身? (煽りじゃなくてね)
後ろにつながる品詞は同じだが、
県の前に接続する品詞と、宮城の前に接続する品詞が違うという話。
「宮城県に出張に行った」は言うけど「県に出張に行った」は言わないでしょ?
あと、確かに左文脈と右文脈は別々に定義できるようになっているけど、
実際の辞書は左文脈ID=右文脈IDなので、やっぱり区別できないと思うよ。

337:login:Penguin
10/06/03 21:44:04 PxaC1S8F
uze-

338:login:Penguin
10/06/03 21:52:20 pPPT4Ls/
一般名詞と接尾の「県」は別個に登録されているから区別できるんじゃないのか?

339:login:Penguin
10/06/03 22:26:56 wmng9tJY
>>336
宮城県に
県に
言うでしょ。

340:login:Penguin
10/06/03 23:00:05 wmng9tJY
駅名なんかをみると、左文脈IDと右文脈IDが異なっている複合語を見かけるけど、幻覚なんだろうか?
それとも、変換エンジンが無視しているって話?

341:login:Penguin
10/06/04 01:57:57 ZO43vMX/
コンパイル中暇だからソース漁ってたら…
これは酷い
URLリンク(mozc.googlecode.com)

342:login:Penguin
10/06/04 02:06:05 kzCJPyMQ
いまさら。

343:login:Penguin
10/06/04 02:14:04 ZO43vMX/
あれ?
mozcってLinuxだけだよね?
Windows用のプログラムも混じってない?


344:login:Penguin
10/06/04 04:21:19 4TzFfVhZ
いまさら。

345:login:Penguin
10/06/04 06:17:40 mBX7YmR0
私家版辞書を追加したmozcを変換効率だなどと頻りに擁護するバカがいついてる模様

346:login:Penguin
10/06/04 10:04:52 NpMgVDdo
PCが無いと「頻りに」なんて漢字出てこないバカどもの議論ってこと?

347:login:Penguin
10/06/04 11:01:45 sE1oayZo
345はただの基地外なので放置推奨

348:login:Penguin
10/06/04 13:00:07 mBX7YmR0
>>335 >>347
>>345

349:login:Penguin
10/06/04 17:15:10 YpJdVChb
mozc/ipc/unix_ipc.ccだとローカルソケット(socket AF_UNIX)使っていて、
mozc/ipc/win32_ipc.ccだと名前付きパイプ(CreateNamedPipe)使っているけど、
ローカルソケット(socket AF_UNIX)をwindowsでそのまま使わなかった理由はなんなのだろう。

350:login:Penguin
10/06/04 19:08:43 YpJdVChb
自己解決した。たぶん理由は2つ
1.IPスタック
 WindowsのAF_UNIXソケットはIPスタックを回避できない
2.セキュリティ上の問題
WindowsのgetsocketoptはSO_PEERCREDが使えないため、
 アクセス元の情報を取得出来ない

これを避けるには名前付きパイプを使えばいいのか...な...たぶん

351:login:Penguin
10/06/04 19:38:47 2qDpkCoq
もずく酢

352:login:Penguin
10/06/04 19:46:47 ov5hWS+Q
iBus立ち上がらねぇぇぇええええ
藻屑はインストール出来て設定まで出来ているのに・・・・・    @SUSE

353:login:Penguin
10/06/04 20:06:23 QQcLRn+n
そういえば、モズクの辞書を逆にメカブで使ったら性能どうなるんだろ?

354:login:Penguin
10/06/04 22:07:20 kzCJPyMQ
mozc の辞書ってそんなにいいの?

355:login:Penguin
10/06/05 02:12:01 lBoLIUKF
>>352 ん?iBus何か難しいことあったっけ?シェルからibus-daemonでどんなエラー出てる?

356:login:Penguin
10/06/05 06:19:24 D5PsWP6U
>>354
mozcの辞書がいいのではなく、UTUMIさんの辞書がいいだけ。
それを勘違いしてGoogleってスゲーって言ってるバカが、変換効率がいいとかいってるだけの話。

357:login:Penguin
10/06/05 06:49:54 xabQhbJd
たしかにUTUMIさんの辞書はいい
mozc使う人は素のmozcの能力を見極めて
改良に努めるべき。

358:login:Penguin
10/06/05 08:30:41 g/NHqkpU
>>356
しつこいなanthy君w

359:login:Penguin
10/06/05 09:10:15 r9Lhvdmg
Mozcのデフォルト辞書はあんまり人の目でチェックされてない感じがする。
「べっさつ」と入力して方向キーの↓を押し続けると、
別冊すてき
別冊家庭画
別冊花

別冊すてきな奥さん、家庭画報、花とゆめ、が途中で切れたのかな。

べびーざら 2239 2318 6181 ベビーザら
「ベビーザらス」だな。

未知語の自動収集精度が良くないのかもなあ。
いや全体的にはそこそこの精度なのかもしれないが、
ノーチェックで収録してしまう感覚がまずいのかも。

わかりやすいのは「ん」ではじまるやつ。
ンコ気持、ンコさん、ンコたち、ンコちゃん、ンバーワン、ンピングカー、
ンブラー、ンプ場...
全くチェックしてないんだろうなあ。
きちんとしたIPAdic+雑な自動収集語という感じ。

頻度設定も怪しいところが。
「ふくらはぎ」と入力すると「フクラハギ」が第一候補。
よく使われるのは平仮名表記のはず。

何度か話でてると思うけど、短い文節だと極端に精度下がるのも気になる。
(入力終えて部分修正するときに、目的の表現がなかなか出てこないことがある)
「云い始めた」が第一候補になったり。
「そんな事を言い始めた」だと「言い始めた」になるんだが。

360:login:Penguin
10/06/05 09:19:22 fhMYXk7C
人力でどうこうやるのはGoogleの文化じゃないんだろう。


361:login:Penguin
10/06/05 09:29:33 r9Lhvdmg
なんじゃこりゃ系の登録

わーほりいぎりす 2239 2239 8157 ワーホリイギリス
ーとくん 2239 2319 6228 ートくん
ーままさん 2239 2319 7097 ーママさん
ヾの 2239 2239 8280 ヾノ
ぇんと 2239 243 7023 ヴェンと
いきちやん 2303 2303 8986 益暢
けんてんのう 2303 2239 7136 謙天皇
(孝謙天皇?)
このごろろ 2290 2239 7931 このごろろ
こんじょうてんのう 2239 2239 7590 今上天皇
(きんじょう)
こんすか 2979 2239 7552 今スカ
こんすたじお 2979 2239 7788 今スタジオ
こんすたっふ 2979 2239 7540 今スタッフ
こんすとれす 2979 2239 7788 今ストレス
こんすぽーつ 2979 2239 7626 今スポーツ
こんすーぱー 2979 2239 7227 今スーパー
こんせいかつ 2979 2234 7293 今生活
こんせいふ 2979 2239 7841 今政府
こんせいり 2979 2234 7849 今整理
こんせいり 2979 2239 7392 今生理
こんせけん 2979 2239 6929 今世間
こんせっけい 2979 2234 7924 今設計
こんせっと 2979 2239 7746 今セット
こんせつめい 2979 2234 7180 今説明
こんせぶん 2979 2301 6735 今セブン

適切な表現も混じってるかもしれないが、収録するほどでもないだろと

362:login:Penguin
10/06/05 09:38:44 r9Lhvdmg
>>360
まあなあ。

Google IMEの辞書ぐらい質を量で押し切ればいいんだろうけど、
現状だと中途半端な感じ

363:login:Penguin
10/06/05 10:12:08 D5PsWP6U
>>358
しつこいな変換精度くんw
辞書以外のところでmozcがどう変換精度が優れてるのか説明してみろ

364:login:Penguin
10/06/05 10:38:19 FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなw

365:login:Penguin
10/06/05 10:43:36 GieRvdIi
変な日本語w

366:login:Penguin
10/06/05 11:44:27 r9Lhvdmg
こんな記法もあるのか?
{こうたろう/ひろたろう} 2303 2303 5867 廣太郎

あとゴミっぽい収録語の続き
ヶせっと 2239 2239 8037 ヶセット
ヶらヶら 2239 2239 7784 ヶラヶラ
ぁでふぉるまにあこれくしょん 2239 2239 8118 ぁでふぉるまにあこれくしょん
んたーねっと 2239 2239 8085 ンターネット
んでぃーず 2239 2239 8230 ンディーズ
んぷさいと 2239 2239 8410 ンプサイト
んぷふぁいやー 2239 2239 8385 ンプファイヤー
んらんど 2310 2310 5391 ンランド

中黒付きの未知語は取れない?
ばらくおばま 2239 2239 7916 バラクオバマ
バラク・オバマ無し

変わった読みかたのチェックが甘い?
ばり 2239 2239 6859 尿

どこかで出てたご変換(「誤変換」が出ないし「誤」もなかなか出ない)
あいぱっど iPod

「がい 買い」も出にくい。「臥位」よりも後。
「あと 後」の優先度も低いなあ。
「よりも|あと」だと7番目。
「あと」単体でも「跡」より下になる。

367:login:Penguin
10/06/05 12:26:17 R3XOmDMP
>>366
イって打ったあと、ンターネットって打ったりする人のために・・

368:login:Penguin
10/06/05 12:44:57 D5PsWP6U
>>364
結局変換精度の説明は出来ないってことですね?w

369:login:Penguin
10/06/05 13:27:13 r9Lhvdmg
単漢字で出にくいもの。

「ち 日」出るのが早すぎ。そもそも必要?
「こ 子」なかなか出ない。
「だん 男」なかなか出ない。
「くん 組ん」出るのが早すぎ。「君」「くん」を優先。
「じん 腎」出るのが早すぎ。「人」を優先。
「かみ 上」最優先にするものではないと思う。「紙」「神」を優先。
「せい 生」全然出てこない。かなり下にある。
「とう 頭/冬/島など」なかなか出てこない。
「かい 回」なかなか出ない。
「きょう 強」なかなか出ない。
「じ 時」なかなか出ない。
「さる 申」「猿」を優先。

「そよぐ」普通に変換すると「そよぐ」になるが、
「戦ぐ」が第一にサジェストされるのはなぜ?
こういうケース結構ある。

「たんさん 単三」候補がない。

370:login:Penguin
10/06/05 14:58:33 7VLh6t0e
>>368
そんなこと言ってると、mozcの変換精度が他と比べてたいしたことないってこと
説明してよと言いたくなるじゃないか。

371:login:Penguin
10/06/05 15:17:11 R3XOmDMP
まあ何はともあれAnthy以外に選択肢ができたのはいいことだ。

372:login:Penguin
10/06/05 16:19:04 SieYDk6Z
? ATOKがあるじゃん。

373:login:Penguin
10/06/05 16:32:36 ZADDM2Q0
>>367
ゴミとか言ってる奴は変換辞書を国語辞典かなにかと勘違いしてるんじゃないの?

基本的には自動収集で大は小を兼ねるって思想だよな、元々の辞書に比べて足りない方が問題。
ケチくさい奴は他の変換使ってればいいよ。

検索屋の発想だから、悪影響のあるゴミはルールで排除って感じでしょ?
結局そこんとこがグーグルの肝なのでフリーになってない訳で。

374:login:Penguin
10/06/05 17:21:43 rTZo1uGy
ヶセットは~個セット、ヶラヶラは笑い声の擬音かな
「こせっと」「けらけら」の読みで変換できるといいね

ところで、「か」「が」「こ」で「ヶ」が出ない

375:login:Penguin
10/06/05 17:44:16 D5PsWP6U
>>370
変換精度云々言い出したのは、Googleとmozcをマンセーしてるやつの方。
一般的には選択肢が増えた程度の認識しかない。

376:login:Penguin
10/06/05 18:00:55 r9Lhvdmg
>>373
>>362 >>359

>>374
> ヶセットは~個セット
そうだな。
しかし「けせっと」だと「毛セット」、
「こせっと」だと「小セット」になって、
「ヶセット」が出ない。
sannxkesetto、とかじゃないと出ないな。

Google IMEの辞書から秘密情報を取り除いて、
低頻度の表現をバッサリ削ったもののほうが、
精度としては良くなる気がする。

377:login:Penguin
10/06/05 18:13:22 r9Lhvdmg
Mozcで困るのは、先々の方針がよくわからないことだなあ。
これだけ早く設定ツール出すんだったら、
mozc-configの人もCUIまででやめてたんじゃないかな。
(止めてたんじゃないかな、が出ない。)
辞書をチェックするにしてもツール作るにしても
ムダデマ(無駄手間、が出ない)になる恐れがある。
あとで嫌な思いしないように(ように、の順位低い)、
眺める程度のことしかできない。

変換確認にしたって辞書がゴソッと変わったらイチからやり直しだもんな。

378:login:Penguin
10/06/05 18:31:21 ZADDM2Q0
>>376
取り除いたら出なくなって駄目駄目だろ。
品詞別にフィルタでも掛けてたんじゃないの?

379:login:Penguin
10/06/05 18:42:40 ZADDM2Q0
mozcの作りは聞いた限りでは意外と教科書通りというか、オーソドックスな印象を受ける。
むしろ、最新研究てんこ盛りの筈のanthyの結果が振るわないのがおかしいんだよ。
辞書に関してはmozcに流用しただけで評価されているのだから問題は無さそうなのに。

380:login:Penguin
10/06/05 19:12:30 ZADDM2Q0
>>377
選択肢を増やすことを、無駄手間と考えてしまうエコノミックアニマルこそ開発にとって問題なのかもしれない。
例えばGCCがあったからこそ他の開発ツールが対抗して無償化したりした訳で、それと同じだと考えればいい。
大体そんなこと言ってたら、gtkだのqtとかこそ無駄手間でバカバカしい。

381:login:Penguin
10/06/05 19:58:50 r9Lhvdmg
時々語尾がおかしいな。
そんなやつが痛な (いたな)
冷静な自分が板 (いた)

やっぱ人名弱いな。
損|正義

やっぱ中黒なしだけか。
ジョニーデップ

現時点での感想。
・ある程度の長さを入力した時の第一表記は筋がいい。
・しかしよくある第二表記を選ぼうとするとなかなか見つからないことがある。
・短い読み入力だと精度がぐっと落ちる。
・特に単漢字に関しては頻出語がなかなか出てこなかったり、
頻出語に変な読みを当てたものが上位に来たり。
(人がチェックしていないのでしかたない)

ちょっとずつ変換する人や、
推敲して部分修正を繰り返す人は、
変換精度のギャップに戸惑うかも。

テストはぜんぶ素もずくでやった。
他の人もテストしてくれるとありがたいな

382:login:Penguin
10/06/05 20:24:21 ZADDM2Q0
>>381
実証は大切だけど、そもそも辞書眺めてれば気がつくよ。
ipadic辞書を人がチェックしてないということは有り得なくて、
元々変換とは逆の目的の、漢字を読み下したり解析するための辞書だったからってだけでしょ。

追加分も手動だとかどっかに書いてなかったっけ?
まあフィルタが封印されている以上、吟味するしかないんだろうけど。

383:login:Penguin
10/06/05 22:54:03 9mDSEu8Q
>>381
そうやっていちいちダメ変換を調べること自体は悪くないんだけど、
やっぱりある程度のカバレッジを持ったテストデータを作って自動で評価できるようにしないとダメだと思うよ

細かい問題を直したら他のところがおかしくなるなんてざらにあるだろうし、
何でもほいほい辞書に足せば精度が上がるというものでもなかろう

384:login:Penguin
10/06/05 23:31:30 EmRTT+mM
>>372
ibusで使えたっけ

385:login:Penguin
10/06/06 00:45:41 OSNssyVe
ibus-mozcだよ。

386:login:Penguin
10/06/06 02:57:14 7kplvdM/
「云いました」「そんなふうに言いました」みたいに
「いいました」がずれるのは、品詞が細かすぎるからかもなあ。

いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

1258 動詞,自立,*,*,五段・ワ行促音便,連用形,*
1259 動詞,自立,*,*,五段・ワ行促音便,連用形,いう
1260 動詞,自立,*,*,五段・ワ行促音便,連用形,いく
1261 動詞,自立,*,*,五段・ワ行促音便,連用形,おこなう
1262 動詞,自立,*,*,五段・ワ行促音便,連用形,おもう
1263 動詞,自立,*,*,五段・ワ行促音便,連用形,使う
1264 動詞,自立,*,*,五段・ワ行促音便,連用形,思う
1265 動詞,自立,*,*,五段・ワ行促音便,連用形,行う
1266 動詞,自立,*,*,五段・ワ行促音便,連用形,行く
1267 動詞,自立,*,*,五段・ワ行促音便,連用形,行なう
1268 動詞,自立,*,*,五段・ワ行促音便,連用形,言う
1269 動詞,自立,*,*,五段・ワ行促音便,連用形,買う
1270 動詞,自立,*,*,五段・ワ行促音便,連用形,違う

「いい/言い」を1258にしたら常に前に出るんだろうな、
少なくとも頻度的には。

前に言葉がないとき1259/1268が弱すぎるのかなあ

387:login:Penguin
10/06/06 07:05:02 icwZ8Ez7
いいま 2239 2291 6486 言いま
じゃないの?

388:login:Penguin
10/06/06 08:18:04 zbnKys/K
mozc-server+dict入れられないんだけど

389:login:Penguin
10/06/06 18:53:11 7kplvdM/
>>387
そうかもと思ったが、違うかもねー。
品詞 2239/2291 言いま の頻度を上げたところで、
品詞 1258/1258 云い にはあまり影響しないんじゃないかな。

単純に同品詞の 1258/1258 言い を作るほうが確実に潰せる。
「他に影響あるかも」と不安になるのであれば、
0 みたいな極端な頻度じゃなく (元の頻度 + 2000) 言い ぐらいにしておけばいい。

何にしても品詞体系をもうちょっと簡素化するか、
1259以降の特殊品詞の項目を1258の一般品詞にも重複登録するほうが
いいんじゃないかと思った。

こんな感じ。
いい 1258 1258 2000 いい
いい 1258 1258 2000 言い
いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

抑えめの頻度で登録すればそれほど悪影響もないと思う

390:login:Penguin
10/06/06 19:07:38 icwZ8Ez7
>>389
汎用品詞の登録を増やしても先祖帰りするだけでしょ。
接続コストの実測値でパターンが似通っているならクラスタ化しても問題ないと思うけど、
そんなデータあるの?

391:login:Penguin
10/06/06 22:07:07 NlLwXMcQ
「おーすとこ」ってやったらサジェストにオーストコリアが出てくるのはさすが。

392:login:Penguin
10/06/07 03:47:24 szI55KPJ
はやくQt依存を切ってGtkにしろよ
libqtなんて入れたくないんだよ

393:login:Penguin
10/06/07 04:18:46 9HlTgDD4
グーグルアースもQtだし、社の方針でしょ
KDEに乗り換える人が増えそう

394:login:Penguin
10/06/07 05:00:56 y4gOikgu
>>392
Gtk版を作ればええやん

395:login:Penguin
10/06/07 22:43:32 mmfdo0Vn
工学系で使える辞書欲しいな

396:login:Penguin
10/06/07 22:53:41 P9Ov0s9m
>>381
短いとやっぱ弱いのかな?
おもわんが重ワンとなるのに
そうはおもわんと入れるとそうは思わんとちゃんと変換される。
わりと区切って入力するのでちょっと戸惑う。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch