mozc / Google 日本語入力 #1 at LINUX
mozc / Google 日本語入力 #1 - 暇つぶし2ch331:login:Penguin
10/06/03 18:26:44 wmng9tJY
>>355
県の後ろにつながるの品詞と、宮城県の後ろにつながる品詞は大差ない。
つまり語頭と語尾の文脈IDを継承すれば済む話。

332:login:Penguin
10/06/03 18:28:03 wmng9tJY
>>325 失礼

333:login:Penguin
10/06/03 19:31:44 HrnMknGo
>>330
筋がいいのはMozcだけど、
IPAdicのせいか文章を細かく区切りすぎるような感じはしてる。
「ご|ご」とか「する|シ」みたいな感じで。
ある程度の長さを入力すれば改善するけど、
やっぱりちょっと細かい感じはするな。
語尾とか複合語の切り方がおかしくなるときがある。

Anthyだとdepgraphだったか語のつながりをある程度まとめてくれるので、
「細かい」って感じはしない。
複合語もcompound.tか何かに大量登録されてるしな。

IPAdicは文章を単語に分割するツールでも使われてるんだっけ。
短い単語に比重がかかりすぎな感じがちょっとする。
複合語を大量追加+短い単語の優先度をちょっと下げる、
くらいの調整はいるかもね。

ちょっと使った感想なんで勘違いかもしれん

334:login:Penguin
10/06/03 19:59:43 AE+ltDI6
>>333

そうだなぁ。検索するときには文章をキーワードにすることはないから、
検索屋さんが作ってるだけに、切り替えみたいなのは欲しいかも。
ibusのプラグインでSKK一発切り替えがあればなぁ。と変態的に思ってる。

mozcの一番良い使い方はおおよそ感じ取れるようになったけど、
やっぱり文節ごとに変換させるのはあまり良くなさそうだな。

335:login:Penguin
10/06/03 20:00:21 eXkP2joF
anthyを頻りに擁護するバカがいついてる模様

336:login:Penguin
10/06/03 20:56:17 0C19uf7w
>>331
あなた中国出身? (煽りじゃなくてね)
後ろにつながる品詞は同じだが、
県の前に接続する品詞と、宮城の前に接続する品詞が違うという話。
「宮城県に出張に行った」は言うけど「県に出張に行った」は言わないでしょ?
あと、確かに左文脈と右文脈は別々に定義できるようになっているけど、
実際の辞書は左文脈ID=右文脈IDなので、やっぱり区別できないと思うよ。

337:login:Penguin
10/06/03 21:44:04 PxaC1S8F
uze-

338:login:Penguin
10/06/03 21:52:20 pPPT4Ls/
一般名詞と接尾の「県」は別個に登録されているから区別できるんじゃないのか?

339:login:Penguin
10/06/03 22:26:56 wmng9tJY
>>336
宮城県に
県に
言うでしょ。

340:login:Penguin
10/06/03 23:00:05 wmng9tJY
駅名なんかをみると、左文脈IDと右文脈IDが異なっている複合語を見かけるけど、幻覚なんだろうか?
それとも、変換エンジンが無視しているって話?

341:login:Penguin
10/06/04 01:57:57 ZO43vMX/
コンパイル中暇だからソース漁ってたら…
これは酷い
URLリンク(mozc.googlecode.com)

342:login:Penguin
10/06/04 02:06:05 kzCJPyMQ
いまさら。

343:login:Penguin
10/06/04 02:14:04 ZO43vMX/
あれ?
mozcってLinuxだけだよね?
Windows用のプログラムも混じってない?


344:login:Penguin
10/06/04 04:21:19 4TzFfVhZ
いまさら。

345:login:Penguin
10/06/04 06:17:40 mBX7YmR0
私家版辞書を追加したmozcを変換効率だなどと頻りに擁護するバカがいついてる模様

346:login:Penguin
10/06/04 10:04:52 NpMgVDdo
PCが無いと「頻りに」なんて漢字出てこないバカどもの議論ってこと?

347:login:Penguin
10/06/04 11:01:45 sE1oayZo
345はただの基地外なので放置推奨

348:login:Penguin
10/06/04 13:00:07 mBX7YmR0
>>335 >>347
>>345

349:login:Penguin
10/06/04 17:15:10 YpJdVChb
mozc/ipc/unix_ipc.ccだとローカルソケット(socket AF_UNIX)使っていて、
mozc/ipc/win32_ipc.ccだと名前付きパイプ(CreateNamedPipe)使っているけど、
ローカルソケット(socket AF_UNIX)をwindowsでそのまま使わなかった理由はなんなのだろう。

350:login:Penguin
10/06/04 19:08:43 YpJdVChb
自己解決した。たぶん理由は2つ
1.IPスタック
 WindowsのAF_UNIXソケットはIPスタックを回避できない
2.セキュリティ上の問題
WindowsのgetsocketoptはSO_PEERCREDが使えないため、
 アクセス元の情報を取得出来ない

これを避けるには名前付きパイプを使えばいいのか...な...たぶん

351:login:Penguin
10/06/04 19:38:47 2qDpkCoq
もずく酢

352:login:Penguin
10/06/04 19:46:47 ov5hWS+Q
iBus立ち上がらねぇぇぇええええ
藻屑はインストール出来て設定まで出来ているのに・・・・・    @SUSE

353:login:Penguin
10/06/04 20:06:23 QQcLRn+n
そういえば、モズクの辞書を逆にメカブで使ったら性能どうなるんだろ?

354:login:Penguin
10/06/04 22:07:20 kzCJPyMQ
mozc の辞書ってそんなにいいの?

355:login:Penguin
10/06/05 02:12:01 lBoLIUKF
>>352 ん?iBus何か難しいことあったっけ?シェルからibus-daemonでどんなエラー出てる?

356:login:Penguin
10/06/05 06:19:24 D5PsWP6U
>>354
mozcの辞書がいいのではなく、UTUMIさんの辞書がいいだけ。
それを勘違いしてGoogleってスゲーって言ってるバカが、変換効率がいいとかいってるだけの話。

357:login:Penguin
10/06/05 06:49:54 xabQhbJd
たしかにUTUMIさんの辞書はいい
mozc使う人は素のmozcの能力を見極めて
改良に努めるべき。

358:login:Penguin
10/06/05 08:30:41 g/NHqkpU
>>356
しつこいなanthy君w

359:login:Penguin
10/06/05 09:10:15 r9Lhvdmg
Mozcのデフォルト辞書はあんまり人の目でチェックされてない感じがする。
「べっさつ」と入力して方向キーの↓を押し続けると、
別冊すてき
別冊家庭画
別冊花

別冊すてきな奥さん、家庭画報、花とゆめ、が途中で切れたのかな。

べびーざら 2239 2318 6181 ベビーザら
「ベビーザらス」だな。

未知語の自動収集精度が良くないのかもなあ。
いや全体的にはそこそこの精度なのかもしれないが、
ノーチェックで収録してしまう感覚がまずいのかも。

わかりやすいのは「ん」ではじまるやつ。
ンコ気持、ンコさん、ンコたち、ンコちゃん、ンバーワン、ンピングカー、
ンブラー、ンプ場...
全くチェックしてないんだろうなあ。
きちんとしたIPAdic+雑な自動収集語という感じ。

頻度設定も怪しいところが。
「ふくらはぎ」と入力すると「フクラハギ」が第一候補。
よく使われるのは平仮名表記のはず。

何度か話でてると思うけど、短い文節だと極端に精度下がるのも気になる。
(入力終えて部分修正するときに、目的の表現がなかなか出てこないことがある)
「云い始めた」が第一候補になったり。
「そんな事を言い始めた」だと「言い始めた」になるんだが。

360:login:Penguin
10/06/05 09:19:22 fhMYXk7C
人力でどうこうやるのはGoogleの文化じゃないんだろう。


361:login:Penguin
10/06/05 09:29:33 r9Lhvdmg
なんじゃこりゃ系の登録

わーほりいぎりす 2239 2239 8157 ワーホリイギリス
ーとくん 2239 2319 6228 ートくん
ーままさん 2239 2319 7097 ーママさん
ヾの 2239 2239 8280 ヾノ
ぇんと 2239 243 7023 ヴェンと
いきちやん 2303 2303 8986 益暢
けんてんのう 2303 2239 7136 謙天皇
(孝謙天皇?)
このごろろ 2290 2239 7931 このごろろ
こんじょうてんのう 2239 2239 7590 今上天皇
(きんじょう)
こんすか 2979 2239 7552 今スカ
こんすたじお 2979 2239 7788 今スタジオ
こんすたっふ 2979 2239 7540 今スタッフ
こんすとれす 2979 2239 7788 今ストレス
こんすぽーつ 2979 2239 7626 今スポーツ
こんすーぱー 2979 2239 7227 今スーパー
こんせいかつ 2979 2234 7293 今生活
こんせいふ 2979 2239 7841 今政府
こんせいり 2979 2234 7849 今整理
こんせいり 2979 2239 7392 今生理
こんせけん 2979 2239 6929 今世間
こんせっけい 2979 2234 7924 今設計
こんせっと 2979 2239 7746 今セット
こんせつめい 2979 2234 7180 今説明
こんせぶん 2979 2301 6735 今セブン

適切な表現も混じってるかもしれないが、収録するほどでもないだろと

362:login:Penguin
10/06/05 09:38:44 r9Lhvdmg
>>360
まあなあ。

Google IMEの辞書ぐらい質を量で押し切ればいいんだろうけど、
現状だと中途半端な感じ

363:login:Penguin
10/06/05 10:12:08 D5PsWP6U
>>358
しつこいな変換精度くんw
辞書以外のところでmozcがどう変換精度が優れてるのか説明してみろ

364:login:Penguin
10/06/05 10:38:19 FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなw

365:login:Penguin
10/06/05 10:43:36 GieRvdIi
変な日本語w

366:login:Penguin
10/06/05 11:44:27 r9Lhvdmg
こんな記法もあるのか?
{こうたろう/ひろたろう} 2303 2303 5867 廣太郎

あとゴミっぽい収録語の続き
ヶせっと 2239 2239 8037 ヶセット
ヶらヶら 2239 2239 7784 ヶラヶラ
ぁでふぉるまにあこれくしょん 2239 2239 8118 ぁでふぉるまにあこれくしょん
んたーねっと 2239 2239 8085 ンターネット
んでぃーず 2239 2239 8230 ンディーズ
んぷさいと 2239 2239 8410 ンプサイト
んぷふぁいやー 2239 2239 8385 ンプファイヤー
んらんど 2310 2310 5391 ンランド

中黒付きの未知語は取れない?
ばらくおばま 2239 2239 7916 バラクオバマ
バラク・オバマ無し

変わった読みかたのチェックが甘い?
ばり 2239 2239 6859 尿

どこかで出てたご変換(「誤変換」が出ないし「誤」もなかなか出ない)
あいぱっど iPod

「がい 買い」も出にくい。「臥位」よりも後。
「あと 後」の優先度も低いなあ。
「よりも|あと」だと7番目。
「あと」単体でも「跡」より下になる。

367:login:Penguin
10/06/05 12:26:17 R3XOmDMP
>>366
イって打ったあと、ンターネットって打ったりする人のために・・

368:login:Penguin
10/06/05 12:44:57 D5PsWP6U
>>364
結局変換精度の説明は出来ないってことですね?w

369:login:Penguin
10/06/05 13:27:13 r9Lhvdmg
単漢字で出にくいもの。

「ち 日」出るのが早すぎ。そもそも必要?
「こ 子」なかなか出ない。
「だん 男」なかなか出ない。
「くん 組ん」出るのが早すぎ。「君」「くん」を優先。
「じん 腎」出るのが早すぎ。「人」を優先。
「かみ 上」最優先にするものではないと思う。「紙」「神」を優先。
「せい 生」全然出てこない。かなり下にある。
「とう 頭/冬/島など」なかなか出てこない。
「かい 回」なかなか出ない。
「きょう 強」なかなか出ない。
「じ 時」なかなか出ない。
「さる 申」「猿」を優先。

「そよぐ」普通に変換すると「そよぐ」になるが、
「戦ぐ」が第一にサジェストされるのはなぜ?
こういうケース結構ある。

「たんさん 単三」候補がない。

370:login:Penguin
10/06/05 14:58:33 7VLh6t0e
>>368
そんなこと言ってると、mozcの変換精度が他と比べてたいしたことないってこと
説明してよと言いたくなるじゃないか。

371:login:Penguin
10/06/05 15:17:11 R3XOmDMP
まあ何はともあれAnthy以外に選択肢ができたのはいいことだ。

372:login:Penguin
10/06/05 16:19:04 SieYDk6Z
? ATOKがあるじゃん。

373:login:Penguin
10/06/05 16:32:36 ZADDM2Q0
>>367
ゴミとか言ってる奴は変換辞書を国語辞典かなにかと勘違いしてるんじゃないの?

基本的には自動収集で大は小を兼ねるって思想だよな、元々の辞書に比べて足りない方が問題。
ケチくさい奴は他の変換使ってればいいよ。

検索屋の発想だから、悪影響のあるゴミはルールで排除って感じでしょ?
結局そこんとこがグーグルの肝なのでフリーになってない訳で。

374:login:Penguin
10/06/05 17:21:43 rTZo1uGy
ヶセットは~個セット、ヶラヶラは笑い声の擬音かな
「こせっと」「けらけら」の読みで変換できるといいね

ところで、「か」「が」「こ」で「ヶ」が出ない

375:login:Penguin
10/06/05 17:44:16 D5PsWP6U
>>370
変換精度云々言い出したのは、Googleとmozcをマンセーしてるやつの方。
一般的には選択肢が増えた程度の認識しかない。

376:login:Penguin
10/06/05 18:00:55 r9Lhvdmg
>>373
>>362 >>359

>>374
> ヶセットは~個セット
そうだな。
しかし「けせっと」だと「毛セット」、
「こせっと」だと「小セット」になって、
「ヶセット」が出ない。
sannxkesetto、とかじゃないと出ないな。

Google IMEの辞書から秘密情報を取り除いて、
低頻度の表現をバッサリ削ったもののほうが、
精度としては良くなる気がする。

377:login:Penguin
10/06/05 18:13:22 r9Lhvdmg
Mozcで困るのは、先々の方針がよくわからないことだなあ。
これだけ早く設定ツール出すんだったら、
mozc-configの人もCUIまででやめてたんじゃないかな。
(止めてたんじゃないかな、が出ない。)
辞書をチェックするにしてもツール作るにしても
ムダデマ(無駄手間、が出ない)になる恐れがある。
あとで嫌な思いしないように(ように、の順位低い)、
眺める程度のことしかできない。

変換確認にしたって辞書がゴソッと変わったらイチからやり直しだもんな。

378:login:Penguin
10/06/05 18:31:21 ZADDM2Q0
>>376
取り除いたら出なくなって駄目駄目だろ。
品詞別にフィルタでも掛けてたんじゃないの?

379:login:Penguin
10/06/05 18:42:40 ZADDM2Q0
mozcの作りは聞いた限りでは意外と教科書通りというか、オーソドックスな印象を受ける。
むしろ、最新研究てんこ盛りの筈のanthyの結果が振るわないのがおかしいんだよ。
辞書に関してはmozcに流用しただけで評価されているのだから問題は無さそうなのに。

380:login:Penguin
10/06/05 19:12:30 ZADDM2Q0
>>377
選択肢を増やすことを、無駄手間と考えてしまうエコノミックアニマルこそ開発にとって問題なのかもしれない。
例えばGCCがあったからこそ他の開発ツールが対抗して無償化したりした訳で、それと同じだと考えればいい。
大体そんなこと言ってたら、gtkだのqtとかこそ無駄手間でバカバカしい。

381:login:Penguin
10/06/05 19:58:50 r9Lhvdmg
時々語尾がおかしいな。
そんなやつが痛な (いたな)
冷静な自分が板 (いた)

やっぱ人名弱いな。
損|正義

やっぱ中黒なしだけか。
ジョニーデップ

現時点での感想。
・ある程度の長さを入力した時の第一表記は筋がいい。
・しかしよくある第二表記を選ぼうとするとなかなか見つからないことがある。
・短い読み入力だと精度がぐっと落ちる。
・特に単漢字に関しては頻出語がなかなか出てこなかったり、
頻出語に変な読みを当てたものが上位に来たり。
(人がチェックしていないのでしかたない)

ちょっとずつ変換する人や、
推敲して部分修正を繰り返す人は、
変換精度のギャップに戸惑うかも。

テストはぜんぶ素もずくでやった。
他の人もテストしてくれるとありがたいな

382:login:Penguin
10/06/05 20:24:21 ZADDM2Q0
>>381
実証は大切だけど、そもそも辞書眺めてれば気がつくよ。
ipadic辞書を人がチェックしてないということは有り得なくて、
元々変換とは逆の目的の、漢字を読み下したり解析するための辞書だったからってだけでしょ。

追加分も手動だとかどっかに書いてなかったっけ?
まあフィルタが封印されている以上、吟味するしかないんだろうけど。

383:login:Penguin
10/06/05 22:54:03 9mDSEu8Q
>>381
そうやっていちいちダメ変換を調べること自体は悪くないんだけど、
やっぱりある程度のカバレッジを持ったテストデータを作って自動で評価できるようにしないとダメだと思うよ

細かい問題を直したら他のところがおかしくなるなんてざらにあるだろうし、
何でもほいほい辞書に足せば精度が上がるというものでもなかろう

384:login:Penguin
10/06/05 23:31:30 EmRTT+mM
>>372
ibusで使えたっけ

385:login:Penguin
10/06/06 00:45:41 OSNssyVe
ibus-mozcだよ。

386:login:Penguin
10/06/06 02:57:14 7kplvdM/
「云いました」「そんなふうに言いました」みたいに
「いいました」がずれるのは、品詞が細かすぎるからかもなあ。

いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

1258 動詞,自立,*,*,五段・ワ行促音便,連用形,*
1259 動詞,自立,*,*,五段・ワ行促音便,連用形,いう
1260 動詞,自立,*,*,五段・ワ行促音便,連用形,いく
1261 動詞,自立,*,*,五段・ワ行促音便,連用形,おこなう
1262 動詞,自立,*,*,五段・ワ行促音便,連用形,おもう
1263 動詞,自立,*,*,五段・ワ行促音便,連用形,使う
1264 動詞,自立,*,*,五段・ワ行促音便,連用形,思う
1265 動詞,自立,*,*,五段・ワ行促音便,連用形,行う
1266 動詞,自立,*,*,五段・ワ行促音便,連用形,行く
1267 動詞,自立,*,*,五段・ワ行促音便,連用形,行なう
1268 動詞,自立,*,*,五段・ワ行促音便,連用形,言う
1269 動詞,自立,*,*,五段・ワ行促音便,連用形,買う
1270 動詞,自立,*,*,五段・ワ行促音便,連用形,違う

「いい/言い」を1258にしたら常に前に出るんだろうな、
少なくとも頻度的には。

前に言葉がないとき1259/1268が弱すぎるのかなあ

387:login:Penguin
10/06/06 07:05:02 icwZ8Ez7
いいま 2239 2291 6486 言いま
じゃないの?

388:login:Penguin
10/06/06 08:18:04 zbnKys/K
mozc-server+dict入れられないんだけど

389:login:Penguin
10/06/06 18:53:11 7kplvdM/
>>387
そうかもと思ったが、違うかもねー。
品詞 2239/2291 言いま の頻度を上げたところで、
品詞 1258/1258 云い にはあまり影響しないんじゃないかな。

単純に同品詞の 1258/1258 言い を作るほうが確実に潰せる。
「他に影響あるかも」と不安になるのであれば、
0 みたいな極端な頻度じゃなく (元の頻度 + 2000) 言い ぐらいにしておけばいい。

何にしても品詞体系をもうちょっと簡素化するか、
1259以降の特殊品詞の項目を1258の一般品詞にも重複登録するほうが
いいんじゃないかと思った。

こんな感じ。
いい 1258 1258 2000 いい
いい 1258 1258 2000 言い
いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い

抑えめの頻度で登録すればそれほど悪影響もないと思う

390:login:Penguin
10/06/06 19:07:38 icwZ8Ez7
>>389
汎用品詞の登録を増やしても先祖帰りするだけでしょ。
接続コストの実測値でパターンが似通っているならクラスタ化しても問題ないと思うけど、
そんなデータあるの?

391:login:Penguin
10/06/06 22:07:07 NlLwXMcQ
「おーすとこ」ってやったらサジェストにオーストコリアが出てくるのはさすが。

392:login:Penguin
10/06/07 03:47:24 szI55KPJ
はやくQt依存を切ってGtkにしろよ
libqtなんて入れたくないんだよ

393:login:Penguin
10/06/07 04:18:46 9HlTgDD4
グーグルアースもQtだし、社の方針でしょ
KDEに乗り換える人が増えそう

394:login:Penguin
10/06/07 05:00:56 y4gOikgu
>>392
Gtk版を作ればええやん

395:login:Penguin
10/06/07 22:43:32 mmfdo0Vn
工学系で使える辞書欲しいな

396:login:Penguin
10/06/07 22:53:41 P9Ov0s9m
>>381
短いとやっぱ弱いのかな?
おもわんが重ワンとなるのに
そうはおもわんと入れるとそうは思わんとちゃんと変換される。
わりと区切って入力するのでちょっと戸惑う。

397:login:Penguin
10/06/07 23:08:44 LJSwkYCS
思い
思うとき
思えば
オモワン

なんだろうなこれ。

398:login:Penguin
10/06/07 23:29:43 LJSwkYCS
思わぬ が変化したのが 思わん なのか、日本語って難しいな。

399:login:Penguin
10/06/08 05:34:28 B/3137Xj
難しいっつうより頭がおかしい。

400:login:Penguin
10/06/08 10:43:12 X+aW8Khr
>>396
「思う」という動詞が他動詞で、必ずその前に節を持つからかな?
「思わん」も「ん」が否定の助動詞「ぬ」の音便化なら、未然形に活用してるだけで、
特に不思議でも難しくもないと思うけど。

思わ/ない(ぬ、ん)
思い/ます
思う
思う/とき
思え/ば
思え

401:login:Penguin
10/06/08 11:58:56 umojQr77
思はぬ → 思わぬ → 思わん

402:login:Penguin
10/06/08 15:53:25 M67rsOKg
>>400
完成した文章を1文単位で分析して頻度を出した場合、
「xxxxである。思わん。xxxx。」みたいな表現はまず出てこない。
だから「思わん」単体だと全然優先されないのかも。

でも実際の入力では考え考え入力するわけだから、
1-3文節ずつぐらいで入力することが多いのだろう。
推敲の過程で「思わん」だけを入力することもよくあるはず。

1文単位で分析して語の結びつきを調べるだけでなく、
1-3文節ぐらいでの優先度も加味して辞書の頻度を出せたらいいのかもね。

まあこれを簡易にやるとしたら、
「思わん」の表記と頻度情報を
汎用動詞のところにも追加することかな。
(手元に資料がないので「思わん」の品詞がどうなってるかわからんけど)
>>389みたいな感じ

403:login:Penguin
10/06/08 20:56:27 M67rsOKg
URLリンク(www.google.com)"TODO"+package:"URLリンク(mozc.googlecode.com)"
TODO 99件ですか。確かに大変そう。

trunk/src/converter/candidate_filter.cc
136: // This is a temporal workaround for fixing "おそう" => "御|総"
137: // TODO(taku): remove it after intorducing a word clustering for noun.
138: if (candidate_size >= 3 && candidate->nodes.size() > 1 &&

一時的とはいえ、場当たり的にフィルタ作ってもキリがないかも

404:login:Penguin
10/06/09 22:18:15 nAHqWJMV
mozc 空気嫁内
anthy 食う清めない

どっちも馬鹿だorz

405:login:Penguin
10/06/09 22:21:21 f1C41BBe
空気を読めない、が正しい日本語であって、
変な日本語まで相手にしないといけないからIMって大変だよな。

406:login:Penguin
10/06/09 22:33:39 Ws4Lks8p
空気嫁を辞書に載せる必要あるのかって

407:login:Penguin
10/06/09 22:36:40 RIVNiz1o
損なことは主っていません
(そんなことは思っていません)

辞書いじったからかと心配したら、
デフォのもずくでもこうだった

>>404
「てにをは」抜きはユーザのバカもちょっとある。
リロードしたら>>405が書いてたか

408:login:Penguin
10/06/09 23:12:10 nAHqWJMV
mozc それは位置理あるぜ
Anthy それは一理あるぜ

やっぱmozc馬鹿だ
変換精度とか言ってた馬鹿出てこい

409:login:Penguin
10/06/09 23:12:47 SiUAEJXW
>>406
とりあえずオレのTENGAに謝ってくれるかね

410:login:Penguin
10/06/09 23:15:32 nAHqWJMV
>>407
mozc そんなことは主っていません
Anthy そんなことは思っていません

やっぱmozc馬鹿だ
↓こういう馬鹿
364 名前:login:Penguin [sage]: 2010/06/05(土) 10:38:19 ID:FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなw


411:login:Penguin
10/06/09 23:22:03 NYLHc+6y
一度変換したらサジェストで出るのが賢いって事じゃないの?
物を知らない奴とバカな奴は別だな。

412:login:Penguin
10/06/09 23:26:36 mucBmdtX
ごくわずかな部分を見て全体をわかったつもりになる馬鹿

413:login:Penguin
10/06/09 23:36:17 qhED6547
>>408
あなたが使っているAnthyは「素」のAnthy?
それともUTUMIさんのModified Anthy?

私はmozcもAnthyもどちらか一方に肩入れするつもりは無いが、
変換精度とかいう話を持ち出すのであれば、どちらも「素」の状態で、
なおかつ、未学習の状態で比較すべきだと思うが。

414:login:Penguin
10/06/09 23:50:28 h+8Jcbr2
ずっとそんな状態で使うわけじゃないんだから、
その条件で比較する意味なくね?
例えばその条件でanthyの方が優れているとしても、
使うにつれ個人用の学習データが小さい素のanthyのが
素のmozcより使いにくく感じるだろうし。

415:login:Penguin
10/06/10 01:23:25 mbMJMOce
>>413
お前が、それじゃ辞書の初期の重みづけを判別するだけってことすら理解出来ない
知能ってことは理解してあげた。

416:login:Penguin
10/06/10 01:25:38 rK/aqtCT
>>415
日本語でおk

417:login:Penguin
10/06/10 01:38:32 f9YWW83E
>>413
変換精度に辞書は関係ないと思うんだ。
UTUMI氏の辞書追加してGoogleってすげーってか。

418:login:Penguin
10/06/10 08:03:02 YeHzUdmw
anthy擁護し続けてる一匹のバカはニホンゴもまともにかけないんだから
変換精度がどうのこうのの問題以前だw

419:login:Penguin
10/06/10 08:14:27 YW5C5UEV
多さ、
が出てこないで大さになるのには閉口した。
Rev28

420:login:Penguin
10/06/10 12:23:39 sjq9s/0m
>>417>>418
コテつけて他の人と区別できるようにしてから
二人で殴り合いしてくれないか

421:login:Penguin
10/06/10 18:04:01 f9YWW83E
>>418
バカじゃなくて馬鹿
ニホンゴじゃなくて日本語
かけない→書けない
確かにお前は日本語もまともに書けないね。

422:login:Penguin
10/06/10 18:26:27 fPMmYVAZ
そんなことは思っていません

423:login:Penguin
10/06/11 18:00:40 7svKIEvM
目糞と鼻糞が罵り合ってるスレと聞いてやって来ましたw
>>417が目糞で、>>418が鼻糞ですか?

424:login:Penguin
10/06/11 19:18:48 dbkzlWEr
>>423
いえ、耳くそですキリッ

425:login:Penguin
10/06/11 19:26:16 7svKIEvM
>>424
耳糞さんも参戦ですか!?
目糞、鼻糞、耳糞の3竦みはどうなっているのでしょうか?


426:login:Penguin
10/06/11 21:31:44 HBiF4xvh
なんか、使ってると少しずつ馬鹿になってない?
UTSUMIさん辞書を追加した直後は、オレ的に一発目で9割以上思い通りに変換してくれるように
なった印象があったんだけど、最近ちょいちょい変な変換するようになってきたような気がする。
一発目でほぼちゃんと変換してくれるので文節とか全然気にしてなかったせいなのか、辞書を
追加した副作用なのかよくわからんけど。
なんかチャーリー・ゴードンを思い出したぜ。

427:login:Penguin
10/06/12 00:40:01 LX/B/Aqs
勝手に辞書追加しておいて文句言ってもダメだと何回言われたらわかるんだ

428:login:Penguin
10/06/12 00:42:14 CoCYPUhz
説教房

429:login:Penguin
10/06/12 00:47:55 g96ojhEY
UTUMI氏の辞書追加して変換精度とかほざいてた馬鹿涙目www



430:login:Penguin
10/06/12 02:45:59 vZS9Vjdk
>>427
目糞乙。
>>429
鼻糞乙。

431:login:Penguin
10/06/12 09:24:21 HwPSTama
mozc きょう体
Anthy 筐体

ちょw

432:login:Penguin
10/06/12 09:37:18 Ba4d1iMj
時代は変わる→mozc
自大は変わる→anthy

433:login:Penguin
10/06/12 12:39:17 vZS9Vjdk
比較するなら、ちゃんとした一文で行うことも必要。
おれAnthyもmozcも無印じゃないから報告できないけど。

434:login:Penguin
10/06/12 12:46:22 g96ojhEY
>>433
つまりおまえも、UTUMI氏の辞書で変換精度とか言ってる目糞くんか

435:login:Penguin
10/06/12 16:08:11 p2A/0vlu
だれか
mozc vs anthyのスレを作ってそっちに誘導してやって。
スレが作れないから。

436:login:Penguin
10/06/12 17:57:36 qhFozSGF
とりあえず、辞書のフォーマットは、よみと品詞相当の左右の文脈IDの組と頻度と変換語で計5要素使ってるって事でいいの?
で、公開版に含まれていないのは、自動収集の膨大な単語と、精密な頻度データと、ググル八分で有名なお得意の不正語フィルタ
って事で合ってる?

437:login:Penguin
10/06/13 02:42:49 JhkzJet+
>>436
公開版のフォーマットは合ってるけど、
非公開版は何せ非公開なのでわからない。

URLリンク(sourceforge.jp)
> Google日本語入力の辞書データはGoogle検索のランキング・
> インデクシングアルゴリズムを反映するような単語の頻度情報を含む

Google検索での単語ランキングとインデクス作成アルゴリズムは隠したい、
ということかな。

> 自動収集の膨大な単語と、ランキングデータ
これは入ってる。

> ググル八分で有名なお得意の不正語フィルタ
これは入ってるかどうかわからない。

短い読みを入力するとズタボロになるっていうのは、
MS-IMEがちょっと前に経験したことだよね。
MSがそれをどう克服したか、っていうのがヒントになるのかも。

変換アルゴリズム変更も含めていろいろ考えていらっしゃるようなので、
URLリンク(twitter.com)
まったりと期待
(Mozc以外のアルゴリズムのことかもしれないけど)

438:login:Penguin
10/06/13 06:12:08 IohsGueo
現状もずくに足りない単語いくつかあるみたいだから、一文節で変換できないものをリストアップするのはいいかもね

439:login:Penguin
10/06/13 07:32:51 JhkzJet+
最終的にはMozcとGoogle IMEの辞書は同じものになるんじゃないかな。
Google社内の人だってWindowsとChrome OSとで同じ変換結果が欲しいだろう。

語彙数を減らしてランキング精度も落とした辞書なら、
公開に大きな支障はないんじゃないかな。
もともと及川さんは「辞書だけ配ったら」って言ってたようだし。
URLリンク(twitter.com)
> プロダクトマネージャの及川って人がいて、
> なんかIME作るの大変そうだから辞書だけ配ったら、と言ったんですね。

秋後半にChrome OSが出るんだっけ?
URLリンク(www.itmedia.co.jp)
てことは9月頃にはMozcがどういう形になるか確定するんじゃない

440:login:Penguin
10/06/13 13:36:49 SDyczpAN
>>421
当て字の馬鹿よりはバカの方が自然だと思う。

莫迦。

441:login:Penguin
10/06/13 14:11:06 kc5+QLJB
しらんけど
しらんケド
シランケド
白んケド

442:login:Penguin
10/06/13 14:13:03 kc5+QLJB
しらんけれど
白んけれど

知りませんわ
知りませんことよ
知らないです
知るかボケ
シーラ内
知らな言ったら
知っとるけ

443:login:Penguin
10/06/13 16:46:26 ubyQDCwZ
なんか変な呪文を見せられてシラケる。

444:login:Penguin
10/06/13 18:41:24 fkFT0NTC
IMEの変換精度って定量的な評価基準ってあんのかね。
論文とかあったりする?

445:login:Penguin
10/06/13 19:06:30 voBenHq7
変換精度より学習能力の方が重要な気がしてきた。

446:login:Penguin
10/06/14 20:37:05 cFzAXehZ
目糞と鼻糞の戦いに決着着いたの?
もっと、罵り合って欲しいな。

447:login:Penguin
10/06/14 20:44:38 itjtAE+X
安thyの糞ブリは誰もが思うことなのに、Gに対する憎しみの余り安thyを擁護する池沼ブリw

448:login:Penguin
10/06/15 09:56:22 WWgmOQND
>>447
午後
五後
御後
碁後
伍後

さすがmozcの変換精度はすばらしいw

449:login:Penguin
10/06/15 16:53:38 eTqgSqS2
>>448
なにそれ?
地方ローカルの変換精度??

450:login:Penguin
10/06/16 08:23:23 aoHW7luQ
>>449
ごごをmozcで変換してみろよカス

451:login:Penguin
10/06/16 17:41:20 wWoolAjK
>>450
午後
午后
ご後
ごご
ゴゴ
gogo
GOGO
gogo


自分で好きな辞書いれて使えばいいんじゃない?
URLリンク(www.geocities.jp)

452:login:Penguin
10/06/16 19:28:46 Gp0Lw4o3
r30きてるよ!

453:login:Penguin
10/06/17 08:30:23 9frVqmCm
>>451
私家版辞書で、Googleってすげー、mozcってすげーってか
mozcは私家版辞書で変換精度も向上しますキリッ
さすがmozcすげーぜwww

454:login:Penguin
10/06/17 08:44:24 9frVqmCm
>>452
そうそう
毎度のことながらまたbuildに必要なソフトが増えてるから、そのままbuildしてbuildできねーとか書くなよな
とくにGoogle妄信的マンセー野郎はな

455:login:Penguin
10/06/17 11:30:57 nd3z9T0m
なんという自演……


456:login:Penguin
10/06/17 13:02:40 XA+wvXLt
わかりやすいanthyバカ自演w

457:login:Penguin
10/06/17 13:56:54 9frVqmCm
自演だって・・・
なんちゅう単純な思考


458:login:Penguin
10/06/17 16:48:51 7Jb8hXGr
>>453
当たり前なことを興奮しながら言うな
気に入ったIMEと辞書を組み合わせて使えばいい

459:login:Penguin
10/06/17 16:53:19 mnF1tUm+
まずはデフォの辞書で精度上げようぜ、って話じゃなかったっけ。

460:login:Penguin
10/06/17 16:59:11 7Jb8hXGr
>>459
そんなのGoogle次第じゃないの?
オープンソースのプロジェクトなんだし
派生版とか野良辞書とか組み合わせて使うほうがLinuxっぽくていいと思うけどね
何でも受身(デフォルト)で使うならLinuxなんていらないんじゃないか

461:login:Penguin
10/06/17 19:00:14 iNMpus7y
>>459
Googleのデフォルトの辞書の定義次第でしょ。
Googleが色々弄った辞書をデフォルトですって言われれば
それがデフォルトな訳だし。

さあ、もっと目糞と鼻糞の掴み合いの取っ組み合いを魅せてくれw

462:login:Penguin
10/06/17 23:37:35 O9N+TpoV
SCIM対応になって、実質誰でも使えるようになったわけだが、
なんでいまさらSCIM対応??

463:login:Penguin
10/06/18 01:45:02 IRUjfEYT
sj3辞書の単語使ったmozcとかどうか?

464:login:Penguin
10/06/18 02:11:30 IRUjfEYT
そういえばさ、2chブラウザのログなんかをコーパスに使って頻度値を書き換えてみたらどうなるのかとかって
やってみた人居ないのかな?

465:login:Penguin
10/06/18 17:29:22 179siXes
>>464
2chからのデータで頻度値を書き換える意味ってあるのか?
日本語を正しく使えない奴らの集まりだぞw

466:login:Penguin
10/06/18 17:37:11 CO7JxFy0
会話が成立してないもんな

467:login:Penguin
10/06/19 03:52:58 zfGxTSJm
r30 だけど、濁音語で濁音なしでないと変換できないことが多いような。
例えば
寿司三昧
とかくのに、
すしざんまい
ではだめで、
すしさんまい
としないと変換出来ない。

何となくだけど、もとの辞書と変換アルゴリズムのコンボで起きてる希ガス

468:login:Penguin
10/06/19 13:31:46 Mym/g2aK
郵便番号辞書が追加出来ない

$ ../../dictionary/gen_zip_code_seed.py --zip_code=KEN_ALL.CSV --jigyosyo=JIGYOSYO.CSV > ./zip_code_seed.tsv
../../dictionary/gen_zip_code_seed.py: line 43:
The tool for generating zip code dictionary.
Input files are shift-jis csv.
Output lines will be printed as utf-8.

usage:
./gen_zip_code_seed.py --zip_code=zip_code.csv --jigyosyo=jigyosyo.csv > zip_code_seed.tsv

Zip code sample input line:
01101,060: No such file or directory
../../dictionary/gen_zip_code_seed.py: line 46: __author__: コマンドが見つかりません




469:login:Penguin
10/06/19 14:31:04 l3MgG8Oj
>>468

python ../../dictionary/gen_zip_code_seed.py …

でやってみそ。
mozcのビルド関連のpythonスクリプトは1行目に #!/usr/bin/python 的なのが書かれてないのが多い。
もしかしたら全部書かれてないかも。


470:login:Penguin
10/06/19 16:53:26 iMfoCnRm
URLリンク(code.google.com)

dictionary.gypのパッチもあてたほうがいいかもしれない。

471:login:Penguin
10/06/19 19:16:12 l3MgG8Oj
おれもにほんおうえんでいそがしい。

オレも日本脳炎で忙しい。

「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
正しい文法じゃないけど、あんまりじゃないか。
ていうか、n の打ち漏らしとかも意識してるんか?

472:login:Penguin
10/06/19 19:21:38 G/AvUYZN
>>471
ちゃんと変換されたぞ?

俺も日本応援で忙しい。

473:login:Penguin
10/06/19 19:37:06 CBTzBt9M
>>471
おれも472と同じだ。0.11.365.1 学習なし で利用してる。
バージョンはなに? どんな環境で使ってる?

474:login:Penguin
10/06/19 19:55:53 l3MgG8Oj
>>473
mozc は r29、学習は有り。
ちょっとあとで ~/.mozc 消してやり直してみる。
もちろん、過去に日本脳炎と変換したことはなかったし、単に「にほんおうえん」
では「日本脳炎」という候補はあがってこない。

475:login:Penguin
10/06/19 20:18:56 Mym/g2aK
いまビルドしたばっかりだが、結果は>>471とおなじ
なぜか似た様な変換で
おれはにほんおうえんでいそがしいは
俺は日本応援で忙しい
と正しく変換される

476:login:Penguin
10/06/19 23:24:46 kbul/T1y
けっきょくmozcもいまいちでAnthyの二の舞か…

477:login:Penguin
10/06/19 23:34:45 l3MgG8Oj
>>476 は試合開始5分で1点入れられると「あーあ、この試合も負けか」とか
言い出すタイプ。

478:login:Penguin
10/06/20 00:53:48 sY951/ta
476は典型的な百姓

479:login:Penguin
10/06/20 01:31:11 XLNwSoJz
>>471
>>472
> 「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
> 正しい文法じゃないけど、あんまりじゃないか。
> ていうか、n の打ち漏らしとかも意識してるんか?

多分、それ。ローマ字かな変換のキータッチのゆらぎに対応するのにややこしいことになってるっぽい。
これに慣れるとまとまった文を書き連ねる場合にSCIM-Anthyのローマ字かな変換の繊細すぎるのが使い物にならなくなる位便利だけど


480:login:Penguin
10/06/20 10:02:02 JCImfZ7g
日本脳炎
てす
日本農業新聞 ワラ

481:login:Penguin
10/06/21 00:55:00 0ZkvIPI4
ページによるんだけどブラウザ(firefox)のフォームに入力しようとすると
全く反応しなかったり入力途中で消えることがあるなぁ。

通常の使い勝ってはもうホント決定版だと思ってるので早くバグ潰して完成度を上げてください。>エロイ人

482:login:Penguin
10/06/21 01:19:36 pzeyIawF
わかる。
よく、サスペンドから復帰した後に、しかも3文字打って、その3文字を変換しようとした時に消えたりする。

483:login:Penguin
10/06/21 04:39:00 T/SvdD9E
うーむ、
Baidu Type
URLリンク(ascii.jp)
Google 日本語入力
URLリンク(journal.mycom.co.jp)

Googleのほうは女子力が足りないかも
おっさんばかりでむさ苦しい
男性女性で入力傾向違うと思うので、
(性差よりも個人差の方が大きいとは思うが、)
チームに女性をいれた方がいいかもね (もういるのかな)
端的にいえば「Mozc☆リリースしました!」とリリースノート書いたり、
かわいいツールバーを企画する人がGoogle IME/Mozcにはいなさそう

ブログ見ても女子色つよい
URLリンク(staffblog.baidu.jp)
スタッフ一同の写真?だよな、スタッフ証つけてるし
URLリンク(staffblog.baidu.jp)

ASCIIのBaidu Typeの記事はなかなか興味深い
> Google 日本語入力と比較されることが多いのですが、
> 実際ユーザー様からの要望などを見ていると、やはり、
> よりライトで、カジュアルな使い方をされている方が多いという印象です。
> かなり短い文節や単語単位で変換を行っている傾向が見てとれ、
> そこからもカジュアルユース中心であると推測しています。
> 『MS-Wordでは他のIMEを使い、ブログやチャットなどでは
> Baidu Typeを使う』というコメントもありました。

Linux版が出たら使い分けできて楽しいかもね
アイコンとかもかわいい感じかつ差し替え可能になったりして

484:login:Penguin
10/06/21 04:41:31 T/SvdD9E
>>481-482
再現手順かいてMozcのIssuesに投げとけば。
URLリンク(code.google.com)

開発者日本人だから日本語でOK

485:login:Penguin
10/06/21 04:55:47 T/SvdD9E
しかしGoogleスタッフの服装は暗いのお
URLリンク(googlejapan.blogspot.com)

あんまり愉快な発想が出そうな感じがしない

486:login:Penguin
10/06/21 05:03:42 cPfJbWjU
>>483
偏見かもしれんが、例えば江沢民市ねとか
変換したら、その日から何かに脅えて
暮らすことになったりするのかな

487:login:Penguin
10/06/21 06:42:13 T/SvdD9E
>>486
そりゃ偏見だし、
Googleだったら安心かというとそうでもない

というか入力すること自体のリスクは極めて小さい
問題なのは入力した文章を公開すること
>>486の文章をMS-IMEで書こうがMozcで書こうがSKKで書こうが、
公開してしまえば最大のリスクが等しく降りかかる
MS-IMEで書いて投稿したらリスクが減るってもんじゃない

いままで「Baidu Typeで『~』って書いたらまずいことになるんじゃない」
みたいな書き込みは何度も見た
その投稿自体に全てのリスクがあるのになあ

つうわけで>>486は今日から
何かに脅えて暮らすことになったりするのかも

488:login:Penguin
10/06/21 07:13:41 40qedJmi
中の人宣伝乙と書けばいいだろうのか
それともスレ違いと言えばいいのだろうか

489:login:Penguin
10/06/21 07:58:13 T/SvdD9E
スレ違いってのは「小橋建太が結婚とは」ぐらいでないと。
許容度が小さすぎるぞ

> 中の人宣伝乙

Baidu Typeは初期にちょっと使ったけど、
長文変換が弱すぎたのですぐ消した
なにより基本的にLinux使ってるので動かせない

まあ記事中でGoogle日本語入力の話もちょろっと出てたし、
Mozcが短い入力に弱い→
意外とユーザは短い文節で入力してるみたい(Baidu Typeは特にそうなのかも)
とういうのが興味深かったのよ

490:login:Penguin
10/06/21 07:59:18 ylQvidjt
Baidu Typeを使おうとは思わない
怖いしなんかキモいし

491:login:Penguin
10/06/21 09:05:18 iwCpYBpi
>>ID:T/SvdD9Eスレ違い。宣伝乙
百度の話題ならこちらへ
日本語入力総合スレッド 4
スレリンク(linux板)l50

492:login:Penguin
10/06/21 10:50:05 shlRNFY2
遅ればせながら、↓で発見。
URLリンク(blog.goo.ne.jp)

これまでanthyで苦労していたので助かった。
googleは嫌いだけど。

493:login:Penguin
10/06/21 18:18:12 R7JTwQ8k
>>492
testerのmozcは辞書もなにも弄ってないbuildかな?

494:login:Penguin
10/06/21 18:24:24 iwCpYBpi
>>493
jaチームとしてのものだから、弄っていないはず
というか、弄ってあっちゃまずい
ubuntu公式に限りなく近い野良ビルド

495:login:Penguin
10/06/21 18:35:17 w8Pl4equ
また変なの発見。>>479がらみかな。

「きょにゅう」は辞書にないのはいいとして、それを一文節にすると、
「居に夕」、「虚に夕」…と、「きょにゆう」になってる。

うーん、バグ報告しづらい事例だなあ。

496:login:Penguin
10/06/21 18:42:00 QhOxbV10
>>495
ちょっと待てw

r30 ツルシ辞書 学習あり

きょにゅう → 巨乳ちゃん

しか候補に来ないw
そんな変換した記憶はないのだが…

497:login:Penguin
10/06/21 19:00:35 w8Pl4equ
>>496
「巨乳ちゃん」は辞書にあるよ。

498:login:Penguin
10/06/21 19:49:24 +Vw920Rk
「知りたい」が変換できないな。これってひょっとして日本語の使い方間違ってる?

499:login:Penguin
10/06/21 19:51:01 3Pda7xvX
ひんちちすき→貧乳好き

500:login:Penguin
10/06/21 20:09:37 R7JTwQ8k
ふいんき 雰囲気
なぜか変換出来る
ネタとしてNG

501:login:Penguin
10/06/21 20:19:40 KDWRbYvc
なんだか分節判定馬鹿になってない?
変な区切りしてるような気がするんだけど。

502:login:Penguin
10/06/21 21:19:50 w8Pl4equ
>>501
同感。俺は学習に問題があるのかなあとか思ってたんだけど。

503:login:Penguin
10/06/21 22:08:17 O0BxWBxz
学習単語ってどこで見れるのかな?

504:login:Penguin
10/06/21 22:10:41 Wiq3Lzso
skkからこっちに切り替えてつかってると 文章ごとの変換になれてないために、
細切れ変換しやすいかな。
ずいぶんなれたけどさ。

505:login:Penguin
10/06/23 07:45:52 JOhAuhsd
Mozcに関係あるかわからないんだけど知っていたらおしえて欲しい
Japanese team のppaからMozc いれたら、火狐で表示する一部サイトのアルファベットのフォントが変わってしまった。
解決方法を知っている人がいたら教えてもらえないだろうか?


506:login:Penguin
10/06/23 07:52:48 +DGSrOjN
zenheiフォントをアンインストールしてみるとか

507:login:Penguin
10/06/23 08:41:19 JfXd+1aw
firefoxの”webページが指定したフォントを優先にする”にチェックが入ってるだけとかは?
firefoxのフォント関係の設定は全部確認した?

508:login:Penguin
10/06/23 11:45:50 pC1bACa4
>>505
ppa なんか使っちゃーいかんな。

509:login:Penguin
10/06/23 11:52:19 hLzgIJgE
何様だよ

510:login:Penguin
10/06/23 11:56:24 5255hG7t
俺様だろ

511:login:Penguin
10/06/23 17:32:42 pC1bACa4
ppa を使うのは、うぶん厨だけw

512:login:Penguin
10/06/23 18:36:17 ReoAaQ2h
つーか、Japanese teamなんてmozc出してたっけ?
testerなら知ってるけどさ。

513:505
10/06/23 20:19:11 JOhAuhsd
>>507
チェック外したら取り敢えず上手いこと表示された。
ありがとん

>>508
これからは気を付けるよ


514:login:Penguin
10/06/24 02:35:58 sjChCSOS
>>505
「testerの意味のわかる人だけ使ってください」って書いてたでしょ。
不具合報告は提出してもいいけど対処法を教えてくれとか全く意味わかってないじゃん。

515:login:Penguin
10/06/24 07:32:17 33cH6iYm
ppaってubuntu以外使えないの?
酷いディストリばかりなんだね(苦笑

516:login:Penguin
10/06/24 19:45:16 icPu4CVC
>515
使える。
libcとか依存するライブラリ揃えて、ar とtar で deb の中身を
展開して、適切に設定したら、別のトリでもいけるだろ。

517:login:Penguin
10/06/24 20:08:53 YIW19YhL
だったらソースから各ディストリのスタイルでビルドしたほうが早いじゃん。

518:login:Penguin
10/06/24 20:35:20 icPu4CVC
使えるか、使えないかで質問したからだ。
ソースがあるから、ライセンス条件に従えるなら、
>577の方法でいいとは思うが、しょーもない煽り
だったので、上記で答えた。ウソではないからね。

519:login:Penguin
10/06/24 20:47:17 5qxOtEj8
openSUSEがクロスプラットフォームなビルドサービスを持ってるよ

520:login:Penguin
10/06/24 20:48:04 3yGS5Qoa
>>515は、どうせVine(笑)使いだろ
困るね世界標準じゃないディストリ使いは

521:login:Penguin
10/06/24 21:00:08 YIW19YhL
>>518
ナイーブなやつだな。
オレなら>>516のあとに一言>>517を付け加えるけどね。
そのほうがよりマシな回答になるだろ?

うーむ、
「その|ほうが」で「その|方が」がでてこない。

522:login:Penguin
10/06/24 22:55:44 CkCzMIm3
make; make; make clean

523:login:Penguin
10/06/24 23:21:36 wGZ7Y5MZ
>>522
誰かツッコんでやれw 放置でカワイソウじゃないか。

524:login:Penguin
10/06/26 18:52:05 Xg08UkVD
しかしMozcの動きずいぶん止まってるね
辞書の作り直しとかやってるのかな

URLリンク(googlejapan.blogspot.com)
> ユーザーフォーラムでのフィードバックをもとに、
> ローマ字ルールの評価方法を改良しました。

これで日本応援→日本脳炎が解消するのかな

> ローマ字のタイプミスの修正機能を拡充しました
> (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)

これは余計なお世話になりそうな予感

念のためだけどMozcには変化なし
> オープンソース版は更新されず

レポートするならMozcのIssuesよりヘルプフォーラムのほうがいいのかも?
Issuesは放置気味だしな
> ヘルプフォーラムをご利用ください。

525:login:Penguin
10/06/26 19:13:52 Z6prY9ic
>>524
おれは
にほんのうえん→日本脳炎
だぞ。私家版Mozc辞書入れてるからな。
どうせお前は淹れ方分からないんだろwwww
へたれwww



526:login:Penguin
10/06/26 19:30:45 ECr4l6RM
>>524
日本脳炎の件だけど、変換前が”にほんのうえん”になってる?”n”が足りてなかったりしない?
意識してないタイプミスのせいだと思うんだけど
その辺の問題があって、 > ローマ字のタイプミスの修正機能を拡充しました。て、ことじゃないかな
たぶん、> ローマ字ルールの評価方法を改良しました。 よりも
タイプミスの修正機能の方が、ユーザーにとっては嬉しいと思う
面倒なんでupdateしてない”Mozc-0.11.356.0”だけど
ちゃんと”にほんのうえん→日本脳炎”になってるよ

527:login:Penguin
10/06/26 19:31:48 lGgUdOwJ
>>525
>>471氏のとおり、「にほんのうえん」だけの変換では正しく変換される
「おれもにほんおうえんでいそがしい」と入力すると
俺も日本脳炎で忙しい
となる
これは私家版辞書が追加されてるとか関係なさげ

528:526
10/06/26 19:42:20 ECr4l6RM
>>527
横からごめん。上記バージョンで、ちゃんと一文丸々一発変換された
おれもにほんおうえんでいそがしい→俺も日本応援で忙しい
辞書は全く弄ってない。変換時に文節区切ってない
過去に、この文を変換したことないんだが

529:login:Penguin
10/06/26 20:17:29 zqTu1dTq
にほんおうえん 日本応援
にほんおうえんで 日本脳炎で
おうえんで 応援で
・・・なんだろうね。

530:login:Penguin
10/06/26 20:25:58 zqTu1dTq
ほんおうえん 本農園
これが怪しいな


531:login:Penguin
10/06/26 21:11:38 7kGVyWfJ
>>529
全部ちゃんと応援になる
脳炎となるのは誤字して学習させただけと思うが
履歴クリアしてみれば


532:login:Penguin
10/06/26 21:16:40 lGgUdOwJ
>>531
~/.mozc消してビルドしたてのmozcでなるわけだが?
誤字の履歴も関係ない

533:login:Penguin
10/06/26 21:24:33 tZ6xhvBL
とりあえず、mozc r29 (r30) 以外のやつは会話に入ってくんなよ。

534:login:Penguin
10/06/26 21:33:17 UNe+Fxsq
r30 辞書そのまま

にほん|おうえん 日本応援
にほんおうえん 日本脳炎

で、デフォルトは「にほん|おうえん」の区切り。

おれも|にほん|おうえんで|いそがしい

で普通に変換されたけど。日本脳炎言ってるやつは
どんな区切りで打ってるんだ?

535:login:Penguin
10/06/26 21:43:40 kzVXlbYu
日本応援って正しい日本語か?

「俺も日本応援で忙しい」
「俺も日本の応援で忙しい」

どう考えても日本語的に、「日本の応援」だろw
正しい日本語も分かってない奴がクレーム付けてもどうしようもないだろ!


536:login:Penguin
10/06/26 21:56:25 tZ6xhvBL
>>535
>>471 を一字一句音読してこい。

537:login:Penguin
10/06/26 22:32:33 kzVXlbYu
>>536
だからよ、「おれもにほんおうえんでいそがしい。」って打ってる時点で日本語変だろw
変換する前に気がつけよw
ブラインドタッチしてたら気が付くだろ変な日本語打ってるの。
こんな変な日本語音読する方が恥ずかしいわw

538:login:Penguin
10/06/26 22:37:09 tZ6xhvBL
>>537
だから>>471は文法的におかしいと分かっている上で書いている。
そして文法的におかしいからと言って、それが「にほんおうえん」→「日本脳炎」という
誤変換のエクスキューズにはならない。
早く宿題済ませて寝ろ。


539:login:Penguin
10/06/26 22:54:32 kzVXlbYu
>>538
* 入力補助機能の改良点
o ローマ字のタイプミスの修正機能を拡充しました (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)

この機能の副産物だろ。それをグチャグチャ言ってる時点で可笑しいんだよw
タイプミス時の修正機能のロジックなんて、お前等に合わせて組んでたら一生掛かっても完成しないだろ。
お前も>>471も揚げ足を取って笑ってる愉快犯じゃねーかw
お前こそママのおっぱい吸ってさっさと寝ろw

540:login:Penguin
10/06/26 22:58:01 kzVXlbYu
>>538
おいw顔と耳真っ赤だぞw

541:login:Penguin
10/06/26 23:02:58 tZ6xhvBL
>>540
ワロスw
俺はおまいがモニタの前で顔真っ赤にしてるメガネっ子の女子校生とみなしてるから
全然構わんぞ。

542:login:Penguin
10/06/26 23:15:44 kzVXlbYu
おっ!?
揚げ足も取れなくなりましたかw
まあ、「日本脳炎」にこだわる小さい人間だから仕方ないかw

543:login:Penguin
10/06/27 00:59:51 CTEwBljB
>>535

(((;-д-)=3ハァ?
日本語的なんて日本語があると思ってるの?
典型的な間違った現代語じゃねぇか。


544:login:Penguin
10/06/27 01:17:45 wU0enjNj
>>543
てき【的】(接尾)
名詞に付いて、形容動詞の語幹をつくる。
1.そのような性質をもったものの意を表す。「文学―表現」「詩―発想」
2.それについての、その方面にかかわる、などの意を表す。「教育―見地」「政治―発言」「科学―方法」
3.そのようなようすの、それらしい、などの意を表す。「大陸―風土」「平和―解決」「徹底―追求」

日本語ちゃんと勉強ちまちょうねw
馬鹿なのがばれまちゅよw

545:login:Penguin
10/06/27 01:58:49 +QfA3FbB
面白いバグを見つけたと思ってレスしたら自分だけだった
そんな事態になったら焦るよ
同情します

546:login:Penguin
10/06/27 02:02:28 pwuJ8VLE

オマエら m9(^Д^)プギャーーーッ

URLリンク(twitter.com)
> Anthyでもそうだったらしいのですが、MeCabもMozcもソフトウェアの動作だ
> けを見て、憶測だけで動作アルゴリズムを「さも専門家のように語る」
> Linuxユーザは本当に勘弁して欲しい。たいてい間違ってるし。オープンソー
> スなんだからソース読んでほしい。


547:login:Penguin
10/06/27 02:08:45 ZR0jbQ7b
間違ってるならちゃんと指摘すればいいのに。
リーナスだってlinuxの全部のソースは知らないって教育テレビで言ってたよ。

548:login:Penguin
10/06/27 02:09:35 toNIO6Zd
>>546
マジレスすると、Linuxはオープンソースなんだからソース読めと言うのは
ソースが読めなければLinuxを使ってはいけないと言う意見なのかね?

頭悪すぎるだろう。

549:login:Penguin
10/06/27 02:15:00 a0nWQ38h
ソース読めないやつは黙って使え
ということだね

550:login:Penguin
10/06/27 02:15:04 +QfA3FbB
>>546
宛先は誰だよ?
>>1-1000にして自分入れるの忘れるなよ

551:login:Penguin
10/06/27 02:18:01 YrTT2Rln
まぁ普通オートマトンの設計者はコーディングもするし

552:login:Penguin
10/06/27 02:19:41 ZR0jbQ7b
そもそも自分以外のソース見て動作がわかる人は、他人のソースは使う必要が無いんだよね。

553:login:Penguin
10/06/27 02:21:38 a0nWQ38h
んなことはない

554:login:Penguin
10/06/27 02:23:33 ZR0jbQ7b
まあ他人のソースを使う人は、自分のソースの動作がわからない人だったりはするね。

555:login:Penguin
10/06/27 02:31:13 a0nWQ38h
何を言いたいんだか

556:login:Penguin
10/06/27 02:38:10 ZR0jbQ7b
バグが治らなくて使いにくいってことだよ

557:login:Penguin
10/06/27 02:44:07 a0nWQ38h
バカが治らないとかそんなに自分を責めなくてもいいと思うよ

558:login:Penguin
10/06/27 02:46:38 +QfA3FbB
例えば、「予測変換」と変換した後に
「よそく」と入力した時点で第一候補に「予測変換」と出るけど
日本語文章で予測変換が続くことは、ほぼあり得ない
携帯辞書も似た様なもんだけど
この辺は設定で変えられたらいいなと思う
さっきの日本応援も一度変換しちゃうと
次は「にほ」で日本応援が第一候補だし


559:login:Penguin
10/06/27 02:48:20 ZR0jbQ7b
流石にバグをバカと変換する仕様なんてのはmozcには無いと思う。
で、それをソースで確認するのってどうやるの?

560:login:Penguin
10/06/27 02:49:49 a0nWQ38h
gdbでも使えば?

561:login:Penguin
10/06/27 02:51:34 ZR0jbQ7b
>>560
じゃあ実演しといて

562:login:Penguin
10/06/27 02:53:30 a0nWQ38h
いやです

563:login:Penguin
10/06/27 02:57:12 +QfA3FbB
しまった
バカの馴れ合いに挟まっちゃった
寝よ

564:login:Penguin
10/06/27 02:57:30 a0nWQ38h
ワタシ、ニホンキライアルヨ
みたいな、日本語変換は難しいよねきっと

565:login:Penguin
10/06/27 02:57:31 ZR0jbQ7b
以上、証明終わり。

566:login:Penguin
10/06/27 02:58:40 a0nWQ38h
バカの証明

567:login:Penguin
10/06/27 03:00:47 a0nWQ38h
バカ証明で忙しい

568:login:Penguin
10/06/27 03:10:23 ZR0jbQ7b
マジメな話、バグの証明って仕様がわからなければ無理だよね。
マシンの中に虫なんか居ないから、意図はともかくプログラムは誰かの書いた通りに動いているわけで。

569:login:Penguin
10/06/27 03:41:36 a0nWQ38h BE:1141095694-2BP(50)
マジメに話をしてもバカw

570:login:Penguin
10/06/27 03:47:20 wU0enjNj
やっぱり、馬鹿ばっかりだなここw

571:login:Penguin
10/06/27 03:56:56 UWF/v0LL
「にほんのうえん」はnihonnnouennだが、nihonnouennとタイプしてしまいそうな・・・。
入力時点ではとりあえず「にほんおうえん」と表記されるが「ん」をn一個でやっちゃったんじゃないかと
思ってくれる親切設計なんじゃないかな。
「官能的」なんかも「かんおうてき」で変換できるんじゃ内科医。

572:login:Penguin
10/06/27 04:17:38 ZR0jbQ7b
>>571
>>546によるとソース読まなければ語るのは勘弁してくれだそうですよ。
しかし日本語関連の人間ってライセンス以外の制約付けるの好きだなあ。

573:login:Penguin
10/06/27 04:34:48 a0nWQ38h
> けを見て、憶測だけで動作アルゴリズムを「さも専門家のように語る」

バカ丸出しで語るオマエはOK

574:login:Penguin
10/06/27 04:50:50 LwleNs7B
日本脳炎の話は、
nihonnouenn と入力してスペースキー押すと「日本応援」になり、
そこから shift+方向キー右 を押すと「日本のうえん」になる。

nihonn|ouen → nihonno|uen → にほんの|うえん

この挙動は意図的なものなんだろうけど、
ぱっと見不思議な感じがするのでIssuesにもレポートが上がってる

入力補助機能の弊害についてはヘルプフォーラムで話が出てる
URLリンク(www.google.com)
> 「しんじよう」と入力すると、サジェストの先頭が「新庄」になってます。

>>546
せめて「~という記述を見かけたのですが」と書いておけば、
誰が間違ってるのか勘弁して欲しいのか分かるのにな
ああいう書き方だと「本当に勘弁して欲しい」相手はしゃべり続け、
役に立つことを書いてる人は気を遣って黙っちゃう

> 憶測だけで動作アルゴリズムを「さも専門家のように語る」
> オープンソースなんだからソース読んでほしい。

「ソース読んでほしい」じゃなく「この解説文読んでほしい」
にならないのは残念
読める文章がないから怪しい解説にみんな食いつくのでは

575:login:Penguin
10/06/27 07:04:46 iCru6Fog
かな入力で、「に ほ ん の う え ん」と
七打すればいいだけなのに馬鹿じゃないかと思うよ
おまえら
悪い頭を良い頭に取り替えてかな入力すればすむ話じゃねーか
身体障害者なのか精神薄弱なのか知らないがバカ入力選んでバカ入力の話を無限ループかよ?

576:login:Penguin
10/06/27 07:11:27 a0nWQ38h
え?

577:login:Penguin
10/06/27 09:29:43 AB/w4Yqf
よくしらんけどいつのまにか、にほんおうえんがにほんのうえんと、それこそ脳内変換されてる。

にほんおうえん→日本応援
にほんおうえんで→日本脳炎で

にほんのうえんを変換したいわけではない
勘違いバカはすっこんでろ

578:login:Penguin
10/06/27 09:33:15 EYDo0gAo
助詞を落とした間違った日本語に訂正機能が働くのは正常。
訂正機能で自分の意図と違う変換結果になったからって文句を言うのはアホ。

579:login:Penguin
10/06/27 09:47:35 AB/w4Yqf
だからって、にほんおうえんでを日本脳炎でと変換していいという理由にはならない

580:login:Penguin
10/06/27 10:09:48 ZR0jbQ7b
ただしイケメンに限る

581:login:Penguin
10/06/27 10:14:21 a0nWQ38h
nihonn ouen
nihon nouen
区切りなしに判別するのは論理的に不可能
日本脳炎という単語が辞書にあるからサジェストされるのが当たり前

わかったか?

582:login:Penguin
10/06/27 10:20:37 ZR0jbQ7b
いや、そもそも設定に項目を作るべきなのでは? そういう副作用がわかっている機能ならば。

583:login:Penguin
10/06/27 10:23:17 a0nWQ38h
いや、そもそも助詞を使うべきなのでは? そういう日本語がわかっている日本人ならば。

584:login:Penguin
10/06/27 10:24:56 a0nWQ38h
だいたい一回やれば学習するものをなんで設定なんかするんだよバカ

585:login:Penguin
10/06/27 10:27:05 a0nWQ38h
だからバカは黙って使ってろって話なんだよ
使ってりゃ学習するんだから
おまえはちっとも学習しないみたいだけどな


586:login:Penguin
10/06/27 10:31:09 AB/w4Yqf
バカなサジェストは不要


587:login:Penguin
10/06/27 10:32:50 a0nWQ38h
バカとして博物館に飾っておきたいくらい

588:login:Penguin
10/06/27 10:40:55 AB/w4Yqf
>>581
>nihonn ouen
>nihon nouen

やっぱりこの馬鹿わかってなかった・・・
にほんおうえんで
にほんおうえんで
にほんおうえんで
  ・    ・
  ・    ・


100回変換してろ

589:login:Penguin
10/06/27 10:44:43 Z9uQG43o
”n=ん”は、ローマ字入力上の慣習
mozcのルールでは、厳密に言えば”ん=nn”
な行の前の”ん”はnnで入力しないと、文節の判定がうまくできなかった
Atokが優秀なのは、それを含めてユーザーのタイプミス等を予想して変換に組み入れていたから
今回、ローマ字のタイプミスの修正機能を拡充したので
少しはイメージ通りの変換に近くなっているはず

590:login:Penguin
10/06/27 10:44:44 AB/w4Yqf
高円宮妃久子さま 日本応援で私的に南ア訪問
URLリンク(www.sponichi.co.jp)


高円宮妃久子さま 日本脳炎で私的に南ア訪問

mozcで書いたら馬鹿誤植になったわけだ

591:login:Penguin
10/06/27 10:51:08 ZR0jbQ7b
>>589
個人的には、シングルクリックで開く並に余計なお世話だと思う。
まあ設定できれば別にデフォルトでも気にしないけど。

592:login:Penguin
10/06/27 10:51:09 a0nWQ38h
バカが使うとそうなりますね

593:login:Penguin
10/06/27 10:52:31 a0nWQ38h
設定こそ大きなお世話だよバカ

594:login:Penguin
10/06/27 10:54:56 ZR0jbQ7b
nn=ん が染みついちゃってるし、今更訓令式で入力する気なんか無いよ。

595:login:Penguin
10/06/27 10:56:21 pDidW01s
>>544

それで?
絶対にどこかのアフォが辞書引いて反論すると思った。
辞書のコピペだけで勝った気になる能無し乙。
その定義のどれを使っても、
「日本語的」「世界的」とか、変な用法の正しさは証明できない。
むしろ、「的」は中国語で「of」に相当するから、
日本語でも誤った用法が定着してるけど、
適当に漢字や熟語を並べても漢語としては主張できるけど、
日本語の熟語には認められない。

大学の教授も同じこと言ってたけど、中学でも習って知ってた。


596:login:Penguin
10/06/27 10:57:30 pDidW01s
最たる誤用法が「自分的」


597:login:Penguin
10/06/27 11:02:23 zdDUWrPs
俺思ったけれど、ID:pDidW01sさんはもっと馬鹿のいない、素晴らしい方々がたくさんおられるスレに行くべきだと思うの
所詮馬鹿ばっかりしかいないし、馬鹿と遊んでたって時間の無駄だし、なにより貴方様まで馬車になるよ

598:login:Penguin
10/06/27 11:08:11 a0nWQ38h
学習によって補完されるのに別に設定を設けろとか
言い掛かりや嫌がらせに近い
そんくだらないパラメータをいちいち加えていたらプログラムが煩雑になるだけ
そんなバカな話をもっともらしく語る始末
>>546の人の気持ちも分かる


599:login:Penguin
10/06/27 11:35:03 tn5sadQB
>>598
バカほど大きい声で言い切るしね。
分かっている人は控えめで謙虚だ。


600:login:Penguin
10/06/27 11:38:53 ZR0jbQ7b
そうやってさも専門家のように語るイケメンさんはソース読んだの?

601:login:Penguin
10/06/27 13:41:53 LwleNs7B
一応だけど、
Anthyでは
nihonnouenn で shift+→ すると、
にほんお|うえん になる
この挙動で苦情は出なかったと思うし、
個人的にも自然に思える

しかしtakuさんの逆鱗に触れたの誰だろ
直前にこれ↓を読んでたので対照的だなあと思った
URLリンク(staffblog.baidu.jp)
> さすがブロガーの皆さん、アウトプットする言葉の正確さや、
> 入力しやすさに非常に関心・ご要望をお持ちで、大変参考になるお話をいただきました。

ユーザが勘違いなことを書くのはある意味当たり前
有益と思える部分だけすくい取っていけばいい
誤解があると思うならドキュメントを書いて説明することも大事

ID:ZR0jbQ7b (14)
ID:a0nWQ38h (20)
書きすぎ

602:login:Penguin
10/06/27 13:45:27 zdDUWrPs
休みの日くらいイッパイ書かせてもいいぢゃないでせうか、と思ふのですが
平日に20とか行ってたらちょっと書きすぎって言ってもいいだろうけど

603:login:Penguin
10/06/27 15:10:45 8AXtkjxO
uim-anthyだと 日本|応援 って最初からでるYO!

604:login:Penguin
10/06/27 15:14:02 iIFZfXGC
そもそも日本応援なんかしなくていい
弱いのが勘違いしてるだけなんだから

605:login:Penguin
10/06/27 16:00:35 AB/w4Yqf
>>604
またそうやって、出来ないことは必要ないことであると脳内変換するのか?

例えば、我々はDRMが必要なのではない。
Gyao!がDRMを使わなくても見れるならそれでいいのだ。
出来なくても構わないが、代わりのものが整備されてこそだと思うのだが。

606:login:Penguin
10/06/27 16:25:36 1lb4fVSL
で、おまえらは何と戦ってるんだ?

607:login:Penguin
10/06/27 16:53:47 IDzQ/UyC
>>606
俺も是非知りたいな。

608:login:Penguin
10/06/27 22:20:33 rwYplf+A
現実とだな。

609:login:Penguin
10/06/27 22:45:58 a0nWQ38h
ソースコンプレックスw

610:login:Penguin
10/06/28 19:05:29 YjEsd8O2
日本脳炎でもっと盛り上がってくれよw

611:login:Penguin
10/06/28 20:50:04 6R0fDxVd
hennaisuru => space => 偏愛する => shift+左左左 =>
変ないする

ローマ字かな変換の話なので、
日本語としての正しさとか辞書のスコアがどうとかは別の話

つまり、
hennaisuru と入力した人が、
区切りを変更しただけで「へんないする」が出たときどう思うか
Anthyみたいなほうがいいんじゃね?と

しかしtwitterでMozcスレ読んでます的なこと書くの恥ずかしいぞお前ら
Aさん
> mozcスレ、おれもにほんおうえんでいそがしい。→オレも日本脳炎で忙しい。
> でどんだけレス消費してるんだ

Bさん
> 2ch の mozc スレが全く不必要に荒れていて
> どんどん ID をあぼーんしていったらスカスカのスレになってしまった!!。
> もう読むのやめよう。

612:login:Penguin
10/06/28 20:55:47 6R0fDxVd
takuさん
> Mozcの「日本脳炎」の話は、UTSUMI氏の辞書に
> 日本脳炎が4206という低いコストで登録されていて、
> 日本応援のコストよりスペルチェックしたほうが有利に働いただけ。

そういう話だったのかな?
スペルチェックそのものがどうなのかという話かと思ってた

> 同氏の辞書を入れない通常のコストは6529と大きくこの問題は発生しない。
> 適当なコスト付けだと副作用が起きる典型例

あー、takuさんが怒ってたのはこれか
素人がコードも読まずに変換精度語るなよ的な

まーMozcが今後どういうふうになるかわからんしね、
mozc-configみたいにさっさと引くのが正解だね

「ぼくに」→「ボク妊娠」
「おれは」→「オレハマッテルゼ」
「すーし」→「徐煕[女弟]」
たまに面白いサジェストが出てきて救われる
笑いって大事ね

613:login:Penguin
10/06/28 20:58:54 Ig8ewDwa
実際、へんないと打ちたいときはhennnaiと、nが3つ続くわけだが。
変換前はひらがななわけで、ローマ字ではない。
しかも、nが3つ続くことを意識して打ってるわけでもない。
多分、Direct inputでも同じだろう。
ローマ字ではへんないだが、へんあいと表示されたのを見て変換してるわけだ。
なのになぜ未だにこういう勘違い馬鹿がいるのか不思議でならない。

614:login:Penguin
10/06/28 21:36:39 vE1RuP2O
>>612
要するに使ったコーパスが偏ってて日本脳炎の出現頻度が不当に高すぎるって話?
そうじゃないなら頻出語が登録されてない暫定辞書の問題じゃないの?

でもそれはこの話の本質的な問題じゃないんだよね。
大体ソース見たってそんな事はわからないもの。
大規模コーパス版のソースが見れれば別かもしれないけど。

615:login:Penguin
10/06/28 21:47:30 teKDYFoA
だから、追加辞書の内容も確認しないでガタガタ騒ぐなって事だろ?
そんなのソース以前の問題だろw
いかにここがバカの集まりだって遠回しに言われてるの気がつけよw
もう、お前等が日本脳炎にかかってしまえよw


616:login:Penguin
10/06/28 21:56:24 vE1RuP2O
デフォルトで出なければ良いって問題じゃないだろう。
学習すればバカになるって言っているのと同じ事だし。
そもそも間違っても仕方がないと思うような間違いなら誰も騒がないんだよね、

617:login:Penguin
10/06/28 22:09:34 to9RUFmG
あーあ、ついにUTSUMI氏辞書公開停止。
人名辞書はありがたく使わせてもらってたんだけど、仕方ないか。

618:login:Penguin
10/06/28 22:15:16 vE1RuP2O
それこそ全然関係ない話なのに八つ当たりだねえ。

本応援と打とうとしたら本農園が出るのは変わらないし。

619:login:Penguin
10/06/28 22:19:06 rfPkQ9oX
あー、ここなんか話かみ合わないと思ったら追加辞書がデフォだったからか
自分でコンパイルしたの入れてたから日本脳炎とか分からなかった。

620:login:Penguin
10/06/28 22:26:52 YjEsd8O2
デフォルト辞書と学習辞書をゴッチャにする馬鹿w
もう死んでしまえよw

【日本脳炎】
日本脳炎ウイルスの感染によって起こる脳炎。法定伝染病の一。
コガタアカイエカの媒介によるため、夏に流行する。感染しても症状の現れないことが多いが、
発病すれば致命率が高く、治っても重い後遺症を残す。

まるで今のお前等のようだwww

621:login:Penguin
10/06/28 22:41:02 vE1RuP2O
しかしcannaやanthyがそんな変換したって誰も話題にしないで放置だよ多分。
そういう話が出てくるのはむしろ熱心なユーザーに恵まれてるんだと思ったほうが良いと思うんだけどなあ。

622:login:Penguin
10/06/28 22:52:10 rfPkQ9oX
考えようによってはヘタレ辞書がトロイ的に本家の評判を落とすことが可能ってことだな
UTSUMIとか言うのがジャストなんとかの手先だったらおもしろいけど

623:login:Penguin
10/06/28 23:05:53 vE1RuP2O
付属辞書とかサンプルというのは大抵ヘタレだからなあ、それで本体がたいしたことないやって評価になったり、
サンプルが熱心なファンが作ったものに差し変わった途端に評判が段違いに高まるソフトとかはよくある話じゃない?
でも逆は無いね。

624:login:Penguin
10/06/28 23:21:26 kV4nwtmV
>>611>>613
重ねうちの数をミスるとか打ち損じで不要な子音が混ざるとかは
よくあるミスなので自動補正が掛かる動作のほうがまとも。

625:login:Penguin
10/06/28 23:28:29 sPL4dOyN
ワシモソーオモウ(´・ω・) ス

626:login:Penguin
10/06/29 01:10:39 6VqNbmTh
むしろ、問題は無いなんて強弁している奴が手先だろう。
だってそんな事言わなくたって、じゃあ原因突き止めてパッチ出してねで済む話なんだし。

627:login:Penguin
10/06/29 01:18:07 YfC2OShb
日本脳炎の原因はどっかの誰かが作った追加辞書だろ?

628:login:Penguin
10/06/29 01:28:02 6VqNbmTh
それだったら一蹴できた話。
結局>>246のやっかみだね。

629:login:Penguin
10/06/29 01:38:07 R344iBrK
そもそも学習によって吸収されてしまう話で
粘着するような話じゃないし、バグでもない

630:login:Penguin
10/06/29 01:44:41 6VqNbmTh
まあ、打ったつもりの無い変換結果を見てもストレスに感じない人は、この話に参加するべきではなかったんだろうね。

631:login:Penguin
10/06/29 01:52:03 R344iBrK
「日本脳炎」で決定して学習させておいて
バグだバグだと喚き散らす

もういい加減にしてほしい

632:login:Penguin
10/06/29 01:57:00 6VqNbmTh
>>631
じゃあなんで無視できないのさ?
中の人なの?

633:login:Penguin
10/06/29 01:58:34 R344iBrK
しまいには認定ごっこだし

634:login:Penguin
10/06/29 01:59:31 TiCyv9WP
学習じゃなくて私家製辞書のせいじゃなかったのか。

635:login:Penguin
10/06/29 02:08:59 R344iBrK
>>634
私家製辞書のせいで「日本脳炎」とサジェストされるわけだけど
おばかさんはその結果で決定してるから、いつまでも「日本脳炎」が上位のまま

おれもUTSUMI辞書を取り込んでるけど、
一回ちゃんと変換すれば日本脳炎なんてでない


636:login:Penguin
10/06/29 02:12:54 SRaABgeP
ようはあほですね→要はアホですね

637:login:Penguin
10/06/29 02:15:26 R344iBrK
例えるなら
「クサイ、クサイ」と喚き散らしながら
自分でウンコ漏らしてることにいつまでたっても
気づかないような欠陥人間

638:login:Penguin
10/06/29 02:19:02 6VqNbmTh
ID:R344iBrK はいつもの煽り屋かな?

639:login:Penguin
10/06/29 02:20:36 R344iBrK
ソースが読めるかどうかとか以前の問題ですね


640:login:Penguin
10/06/29 02:23:50 6VqNbmTh
どちらの方面の方か存じませんが離間工作は順調のようですね。

641:login:Penguin
10/06/29 02:28:27 R344iBrK
認定ごっこばかりじゃなくて
その「臭い」についてきちんと説明してみたらどう?

実際おれの環境じゃもうnihonnnouenと打たないかぎり
「日本脳炎」なんてでないからね

642:login:Penguin
10/06/29 02:34:39 R344iBrK
ローマ字入力の揺らぎまでうまく学習しているように見えますよ

643:login:Penguin
10/06/29 04:00:09 TiCyv9WP
>>R344iBrK
>>630

644:login:Penguin
10/06/29 04:17:25 RAWQ0/Y1
使えりゃいい

645:login:Penguin
10/06/29 04:20:14 RAWQ0/Y1
Win版ATOKにすら入っていない化学薬品名が入っているからレポートが書きやすい
小分けに変換してるからか全然変換アルゴリズムに不満は感じないな

646:login:Penguin
10/06/29 04:20:44 R344iBrK
>>643
解決方法を指南してあげてるのだから
排除される筋合いはありませんね
それでもダメというなら
自分の状況をきちんと説明するべきです


647:login:Penguin
10/06/29 05:59:08 +TY4WfEN
にほんおうえんで日本脳炎が出てくるのに多少の違和感もあるのは確かだが、
むしろ間違った時に救済されることを感謝したい気もします。
設定でこの機能がオンオフ出来ればもっとよいのでしょうね。

648:login:Penguin
10/06/29 07:29:56 3uyU/vOl
男は黙ってかな入力。
ローマ字入力するやつ市ね

649:login:Penguin
10/06/29 07:43:27 R344iBrK
どうしても辞書以外のバグと言いたい人は他の語句で再現性を証明してください

再現しない例ですが
きほんおうりょくで
基本応力で

「基本能力」は内蔵辞書にあります

650:login:Penguin
10/06/29 08:37:33 ttl/G4LE
ていうか、急速に増えた*うぶん厨*がうんこ過ぎたんだろう。

651:login:Penguin
10/06/29 13:38:46 74Hv5Pp4
>>650
泥舟vineのあなたには関係ないことですねw

652:login:Penguin
10/06/29 17:59:43 51I9Kix3
バグじゃないものをバグだと強弁し続けるバグが涌いてるだけだろう。

653:login:Penguin
10/06/29 18:02:45 TiCyv9WP
原因がわかったあともバグだと言ってるやつはどこにいるんだ?

654:653
10/06/29 18:04:11 TiCyv9WP
ん、なんかオレの日本語が変かな。

原因がわかったあともバグだと言ってるやつってどこにいるんだ?

655:login:Penguin
10/06/29 21:15:16 hXbNgCIt
結論は日本脳炎でバグだと騒いだバカ。>>471
結局、分節句切りすら晒してない。

それに便乗して偉そうに語った日本脳炎信者w

結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw

>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…

656:login:Penguin
10/06/29 21:17:15 hXbNgCIt
結論は日本脳炎でバグだと騒いだバカ。>>471
結局、分節句切りすら晒してない。

それに便乗して偉そうに語った日本脳炎信者w

結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw

>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…

657:login:Penguin
10/06/29 21:18:46 D7+eznK6
>>655のようなmozc脳炎信者にも呆れるね

658:login:Penguin
10/06/29 21:46:52 KBAUeBKs
ローマ字のスペル修正機能をユーザ側でオンオフできるようにするらしい
URLリンク(code.google.com)
よかったよかった

659:login:Penguin
10/06/29 21:59:15 D7+eznK6
みんあで→皆で
なるほどね


660:login:Penguin
10/06/29 22:14:34 KBAUeBKs
なんあで =>
第一候補 南アで
第二候補 ナンナで

不自然な感じがするのでたぶん無効にするかな

661:login:Penguin
10/06/29 22:23:40 /XiPgLe+
UTSUMI氏の私家製辞書、配布停止か。
本家辞書が充実してくれるのを期待するしかなさそうだね。

662:login:Penguin
10/06/29 22:31:26 D7+eznK6
ユーザ辞書として公開してくれれば、配布停止する必要もなかった気がするんだが・・・
下手に一緒にコンパイルかけて一体化させるから勘違い野郎が増える。

663:login:Penguin
10/06/29 22:34:21 ozzcNwln
野良パッケージを作るのはいいけど、安易にバラまくな。

664:login:Penguin
10/06/29 22:51:45 yJjHv7qA
話題がループしているがいい加減にしてくれ。
せっかくLinuxでまともな日本語入力がフリーソフトで開発されているのに開発者側も利用者側も不快になるような書き込みばかり。
もう少し楽しい話題をしないか?

665:login:Penguin
10/06/29 22:54:57 OS6yFplC
>>664
楽しい話題を提供してくれ

666:login:Penguin
10/06/29 23:05:02 6VqNbmTh
>>662-663
勘違い野郎とか言う方が勘違いしてる。
バイナリの動作に不満だったらそいつが自分でソース修正してコンパイルすればいいだけの話。
その為の情報を探しているんだろうから周りがごちゃごちゃ言う必要は何もない。

667:login:Penguin
10/06/29 23:08:26 yJjHv7qA
>>665
それもそうだな…
少なくともanthyのようなとんちんかんな文節区切りが無いのと、枯れた最小コスト法(コスト最小探索?)アルゴリズムでMS-IME程度の文節区切りを実現している点が良い。
俺は常用していてもう手放せないと感じている。

668:login:Penguin
10/06/30 07:36:56 LCHbCgjY
>>667
RT @taku910: 憶測だけで動作アルゴリズムを
「さも専門家のように語る」Linuxユーザは本当に勘弁して欲しい。
たいてい間違ってるし。オープンソースなんだからソース読んでほしい。

アルゴリズムは語らない方がいい
>>667がソースを熟読した専門家ならいいけど
それに「MS-IME程度の文節区切り」ってのは感覚でしかないでしょ
自動テストして正解率を比較したのならあれだけど

開発者がいろんな考えを持つのは自由として、
「ですよねー」的な?RTをしている人たちばかりなのが気になった

669:login:Penguin
10/06/30 07:45:15 LCHbCgjY
Mozcのストレステストには「吾輩は猫である」が使われている
src/data/test/stress_test/sentences.txt

src/data/dictionary/collocation.txt
「ねこをかいたい」を変換すると「猫を解体」になる

670:login:Penguin
10/06/30 10:56:52 ituddthA
>>668
何がいいたいのだ?

「アルゴリズムはソースコード読まないなら専門家以外語るな、と開発者がtwitterでつぶやいている。」

「MS-IME程度の文節区切りってのは感覚でしか無い。自動テストして正解率を比較したのならあれだけど」
との発言は矛盾していないか?

Mozcを利用する人はソースコード読まない&専門家以外は黙って使っていろという結論も出せるぞ。
日本語入力の利用者は変換効率を感覚で「良い」「悪い」と捉えるのが普通だと思ったが。

開発者が…のくだりは読解できなかった。

Mozcのストレステストの例は、「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。

まあ専門スレだから技術中心の話題をしたいということか?
行間から俺が勝手に読み取っただけだが。

671:login:Penguin
10/06/30 11:49:27 POSxyKof
>>670
そのmozcは公式から落としてきて、自分でコンパイルした物?
それとも、非公式な所から落とした野良ビルドの物?

672:login:Penguin
10/06/30 12:46:27 LCHbCgjY
>>670
空行そんなに入れなくていいよ

> 枯れた最小コスト法(コスト最小探索?)アルゴリズムで
?とかいってるから、
憶測で動作アルゴリズム語ると怒りだすかもしれんよと。
まあひょっとしたら>>667が専門家でソースも読んでいて、
MS-IMEとの比較も自動テストなり何かして確かな根拠があるのかもしれないけどさ。
なんにしてもその書き方じゃまた切れるかもしれんよと

ただ基本的なことを言うと、
takuさんのコメントは1つの考え方だけど私は賛同しないし、
「そーですねー」的に?RTしてる人たちばかりで
諌めるっちゅうか違う意見を言う「専門家」が誰もいないのが
ちょっと気になったなーというか気持ち悪いなーというか

素人ユーザにしてみりゃ変換結果が全てで、
そこからアルゴリズムっちゅうか何かの憶測をするのもありきたりな話で、
それが大外れだとしてもある意味あたりまえというか、
「本当に勘弁して欲しい」とは小せえなあと。
誤解があるならドキュメント書くなりして説明すりゃいいじゃん

> 「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。
Mozc-0.11.383.102 (「ばーじょん」と入力して変換) だけど変換されないよ。
~/.mozc を削除して再起動して変換してみて。
(知らずに非公式版使ってんじゃねえかなあ)

673:login:Penguin
10/06/30 12:51:49 Rcg/NbLp
>>672
他力本願だな。

674:login:Penguin
10/06/30 15:33:01 ukEf+Mdo
>>672
細かいことは気にすんな。

675:login:Penguin
10/06/30 15:37:09 doYQnZyx
ワカチコワカチコw

676:login:Penguin
10/06/30 15:48:58 r/2ENvNO
せっかく学習したデータ消せとか軽く言うよね

677:login:Penguin
10/06/30 16:09:17 doYQnZyx
学習辞書から通常辞書に登録出来るようになれば問題はないんだけどね。
まあ、その内実装されるでしょう。多分w

678:login:Penguin
10/06/30 18:00:18 pwJmuJKz
なんか信者化した純正厨がうざいよね、一体どこに競合相手が居るというんだろう?
ソース読まない奴は語るなとかいう開発支援スレが2chに欲しいのならム板にでも立てたら良いと思うんだけど。

679:login:Penguin
10/06/30 18:07:13 doYQnZyx
>>678
いやいや認識おかしいでしょ。
デフォルト以外の辞書入れて、バグだなんだと騒ぐ方がおかしいわけで。
デフォルト版で検証しないで騒ぐこと自体が間違い。
Googleの人だって、私家辞書落としてきて調べたりしてくれてるんだし、
使う人が他力本願なのが根本的に間違ってるんだよ。
ここで騒ぐことで開発が遅れてしまってるって事を少しでも考えたほうがいいと思う。


680:login:Penguin
10/06/30 18:10:56 JNIOOCJk
>>658,660
おれも無効にするな。
ていうか、ローマ字タイプミス修正機能はいいとして、変換候補に混ぜこむんじゃなくて、サジェスト的に
表示すりゃいいのに。

>>672
「そーですねー」と思わない人は黙ってるんだと思うよ。2chじゃないんだし。

カッコとカッコ閉じの、片方を変えるともう片方を自動で合わせてくれるのが何気に嬉しい。

681:login:Penguin
10/06/30 18:11:40 pwJmuJKz
2chやつぶやきでおかしいもなにもないじゃない。
公式に乗り込んでいって騒ぐのはバカだけど。

682:login:Penguin
10/06/30 18:16:15 KlM7I6oY
2ch でも twitter でもおかしいものはおかしいよ。

683:login:Penguin
10/06/30 18:16:59 doYQnZyx
開発陣だって見てると思うよここ。
じゃなかったら、コメント出すとは思えないし。
公式で初期の頃にだしてる要望とかバグ報告に回答寄せてないのあるのに
日本脳炎だけ、コメント出すって事は見てるんだよ。

684:login:Penguin
10/06/30 18:18:27 pwJmuJKz
windowsが起動しなくなっちゃいました。 ←なにもおかしくない話、本人に原因があるだけ。

685:login:Penguin
10/06/30 19:39:11 ukEf+Mdo
>>676
まあディレクトリをリネームして試せばいいと言いたいのだろう。行間を読んでみたが。

野良ビルドだろうが公式ビルドだろうが自前ビルドだろうが個人的にmozc日本語入力自体は使いやすいから開発者には感謝している。
いったい何を議論しているんだ?

686:login:Penguin
10/06/30 19:41:00 pwJmuJKz
>>679
デフォルトで報告しろというのは、開発者(ハッカー)が環境を再現するため。
いじっていなければ責任があるだのそんな話のほうがおかしい。
もしなにかお仕着せたいのなら、当然そういうライセンスにしているだろう。

687:login:Penguin
10/06/30 19:42:51 TBI0xEi8
>>685
感謝してるとかそういう話じゃないことは確か

688:login:Penguin
10/06/30 19:50:54 ukEf+Mdo
>>687
了解。

689:login:Penguin
10/07/01 02:04:58 O1Rx4a6P
URLリンク(code.google.com)

690:login:Penguin
10/07/01 17:11:32 eMXnGfuN
きぞん
が出ねぇ
既存設備
既存顧客
なんてのは出る
辞書にないだけ?

691:login:Penguin
10/07/01 17:31:56 80xQIa/W
まず辞書を引け

692:login:Penguin
10/07/01 17:33:01 oD/W1S7f
>>690
きそんでやってみろ

>>辞書にないだけ?
こんなこと書くと袋だたきにあうぞ
神はソースを見れるやつ以外は発言するなと言っている

URLリンク(twitter.com)

693:login:Penguin
10/07/01 17:35:59 JQPkG31l
>>690
atokx3に切り替えれば幸せになれるよ

694:login:Penguin
10/07/01 17:37:35 oD/W1S7f
これからはソースを見ないで発言することを禁止する
変換について文句があっても、ソースを見てアルゴリズムを理解した奴以外は
黙ってろ。わかったな

695:login:Penguin
10/07/01 17:47:37 eMXnGfuN
なるほど既存が変換できないなんていいがかりは名誉を毀損するわけですね

696:login:Penguin
10/07/01 17:51:28 8YRnsdtB
>>690
> 「きぞん」と読むのは、本来は誤り。

なんだってよ。
URLリンク(dic.yahoo.co.jp)

ついでにmozc r31でてる。
相変わらず何が変わったかわからないログ。
ソース読めってことですね、失礼しました。

697:login:Penguin
10/07/01 17:51:46 u6t0dJ7U
きぞん出来ぞん

698:login:Penguin
10/07/01 17:52:58 u6t0dJ7U
きぞんで既存
・・・あれ?

699:login:Penguin
10/07/01 18:02:00 u6t0dJ7U
>>696
dictionary1.txt:きぞんせつび 2234 2234 7728 既存設備
dictionary1.txt:きぞんこきゃく 2234 2239 7298 既存顧客
dictionary1.txt:きぞんじゅうたく 2234 2239 7271 既存住宅
dictionary1.txt:きぞんてんかぶつ 2234 2318 7746 既存添加物

じゃあこの辺は削除でおk?

700:login:Penguin
10/07/01 18:09:37 8YRnsdtB
>>699
そーだねー。

ついでに既出だけど、
dictionary0.txt:ふいんき 2239 2239 5645 雰囲気
も削除してもらったほうがいいよねー。
ネタで使えないから。

ま、決めるのはオレじゃないけど。

701:login:Penguin
10/07/01 18:23:32 WtGrFZjB
「きぞん」も慣用読みとして広まってるから
別に変換できてもいいんじゃない。

702:login:Penguin
10/07/01 18:24:08 jk6rV2dr
mozc (0.12.402.102) lucid; urgency=low

* Ver. 0.12.402.102 on 2010-06-30

-- Yasuhiro Matsuda <mazda> Wed, 30 Jun 2010 13:22:54 +0900

mozc (0.11.383.102) lucid; urgency=low

* Ver. 0.11.383.102 on 2010-06-16

-- Yasuhiro Matsuda <mazda> Wed, 16 Jun 2010 15:39:33 +0900

mozc (0.11.365.102) lucid; urgency=low

* Ver. 0.11.365.102 on 2010-05-25

-- Yasuhiro Matsuda <mazda> Tue, 25 May 2010 16:54:03 +0900

mozc (0.11.354.100) lucid; urgency=low

* Ver. 0.11.354.100 on 2010-05-17

-- Yusuke Sato <yusukes> Mon, 17 May 2010 19:22:54 +0900

mozc (0.10.288.102) jaunty; urgency=low

* Ver. 0.10.288.102 on 2010-03-09

-- Hiroyuki Komatsu <komatsu> Tue, 09 Mar 2010 16:01:11 +0900

changelog ブッ飛んでんなぁ…

703:login:Penguin
10/07/01 19:19:55 dA7ZCbkv
ふいんき→雰囲気
何故か変換出来るのに変な基準だ

704:login:Penguin
10/07/01 21:23:58 QNOaF+w5
>>692
『憶測だけで動作アルゴリズムを「さも専門家のように語る」』のがダメなんだろ、
動作アルゴリズムを語るならソース読めってことだ。


705:login:Penguin
10/07/01 23:05:29 8YRnsdtB
>>704
それネタにマジレスってやつじゃないのか。

706:login:Penguin
10/07/01 23:48:10 NXCs2WvM
ローマ字スペル修正は、ユーザがすべてをオンオフできるんじゃないんだな。
無効になるのはshift+左右で区切りを変更した時だけ。

これはOK。
nihonnouenn => shift+右 => にほんお|うえん

これはNGのまま。
nannade =>
第一候補 南アで
第二候補 ナンナで

必死で「ローマ字スペル修正を無効にする」の項目を探しちまった

707:login:Penguin
10/07/01 23:58:29 8YRnsdtB
>>706
> 無効になるのはshift+左右で区切りを変更した時だけ。

URLリンク(code.google.com)
ではそういうことになってる。
「r32でやったお」と書かれてるが、実際はr31。

708:login:Penguin
10/07/01 23:59:06 NXCs2WvM
辞書は変更ないみたい?
朝昇竜
ごご

郵便番号辞書がちゃんと作られるようになったのと、
credits_*.html が追加されたのと、
バイナリの生成先がout_linuxになったのと、
xmlファイルの生成位置が変わったのと、
/lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、
ぐらいか。

debian/ubuntu以外でパッケージ作る人は毎回振り回されるのお

709:login:Penguin
10/07/02 00:08:36 rmeJlg4T
r33になってるし

710:login:Penguin
10/07/02 00:08:53 89cUsAe4
>>707
そう。issue 16読み直したらそういうことかとがっかりした。
あそこ反応遅いし下手なこと言ったら揉めそうだしなあ

711:login:Penguin
10/07/02 00:18:23 89cUsAe4
けっ構な異気負いで飛んでった
結構な勢いで飛んでった

賢い時とひどい時の差が激しいなあ
間隔が空いたんで辞書に大変更があるかと期待していたんだが

712:login:Penguin
10/07/02 00:33:47 c2/62KOP
>>708
ググッても朝昇竜ってのが出てくるからな。
馬鹿が大勢いるようだ。
馬鹿は死ね

713:login:Penguin
10/07/02 00:35:33 nMrk595a
起き上がり昇龍拳のことじゃね?

714:login:Penguin
10/07/02 01:13:12 fNK5e64Z
>>708
> /lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、

/usr/lib/ibus-mozc/ibus-engine-mozc のままじゃね?

>>709
だからそれはwikiの更新だと何度言えば (ry

715:デムパゆんゆん@ルーピーズ
10/07/02 01:15:03 nEU/qQll
朝昇竜
朝立ちが収まらず嫁のパンツ引きずり下ろすんだろ
若い夫婦によくあること

716:login:Penguin
10/07/02 16:26:08 6ZhhasPq
svn繋がらねぇ…

717:login:Penguin
10/07/02 18:56:58 tmua+Inw
こっちは
朝青龍
朝青龍明徳
しか出ない

718:login:Penguin
10/07/02 23:01:29 NGCZVs6o
>>717
疑問に思うならソースを読め


719:login:Penguin
10/07/03 00:02:35 fNK5e64Z
朝昇竜も朝青龍も辞書にはない。
朝青龍、朝青龍明徳はもはやアンタッチャブルな雰囲気の例の人名辞書にある。


720:login:Penguin
10/07/03 00:02:52 DSeRllmA
SCIMなんかいまさらどうでもいいのに。もったいない。

721:login:Penguin
10/07/03 03:23:29 mJCm1+DY
vineユーザはビルドの鬼というイメージがあるから、詳しい人が多いだろう。
ubuntuユーザの線がつよいな、間違えて喚いているのは。

722:login:Penguin
10/07/03 03:46:57 osDO+o7j
ソース読めと怒られそうだが質問させてください
単語のコストを15000ぐらいの低めにすると変換候補に出てこない場合があるのですが
いくら以上だったら確実に候補に出てくるのでしょうか?

723:722
10/07/03 03:51:54 osDO+o7j
例えば私家版辞書の
ぞうとう 2239 2239 15273 増頭
が出てきません。


724:login:Penguin
10/07/03 08:03:34 Gayxgvn6
>>721
たまにはgentooさんのことも思い出してあげてください

725:login:Penguin
10/07/03 09:30:48 /RusR1qf
>>722
「贈答」のスコア+100ぐらいだったら出るんじゃないですか。
憶測で語るなと怒られそうだけど。
自分で1000ずつスコアを減らして試してみてください。
10数回やれば答えが出ると思いますよ

誰の私家版辞書か知りませんが公式辞書以外を語ると
やっぱりGoogleさんが苦い顔をするので勘弁

726:login:Penguin
10/07/03 11:29:21 ijDcKIcn
人名辞書は増やすほどクソ変換が増える。
歴史辞典に載っているクラスの有名人だけでいい。
夜露死苦みたいな当て字のDQN人名なんか絶対いらね。

727:login:Penguin
10/07/03 13:29:07 i0Hzsx4Q
>>725
巫山戯んな。そういうのは日本語変換の話をわざわざ英語で話すような場所にでも書いとけ。
公式ったってそもそも単なるIPADICの加工品で別に純正でもなんでもないだろ。
しかしICOT条項とやらは関係しないのかねえこれ。

728:login:Penguin
10/07/03 17:05:55 xhrL1imB
標準辞書に入っている
くらかろ 2680 2680 9957 蒙かろ
つよう 2710 2710 12383 勍う
けっか 2234 2234 11491 缺課
も変換できないな。他にも沢山ある。

別の同音の言葉が沢山あっても変換できる場合もあれば
同音の言葉がないのに変換できない場合もある

729:login:Penguin
10/07/03 17:22:24 Gayxgvn6
>>727
私家版辞書で使ってる奴は、それを作った奴のところで話をしろというだけの話だと思う
私家版辞書の変換候補の登録順位の問題までgoogleに押し付けるのはダメだろ

730:login:Penguin
10/07/03 17:31:13 i0Hzsx4Q
>>729
ここは林檎屋でも検索屋でもないよ。
それともキャッシュでここを見ていて勘違いでもしてんの?

731:login:Penguin
10/07/03 19:26:06 6kwkatsd
>>728
他に優先度が強烈に高い単語があると、
多少のことでは他の単語がでなくなるね。
まあバランスを見て候補数を適当に絞るとそういうことになるんだろうね、
って推測で語るなって言われそうだが

732:login:Penguin
10/07/04 17:44:55 rTB+DtcV
r34 uim-mozcで
してみるとか
と打とうとすると、なぜか途中でmozcが死亡する。
ので旧ビルドに戻した。

733:login:Penguin
10/07/04 17:55:58 /oZBUpT3
うちでは問題ないな。

734:login:Penguin
10/07/07 02:21:37 gfyG56xq
質問。
uim-mozcでユーザー辞書ってどう反映させるの?
/usr/lib/mozc/mozc_tool --mode=dictionary_tool で辞書ツールに単語を
登録しても、肝心の uim-mozc の変換候補に反映されない……

735:login:Penguin
10/07/07 09:54:08 LbLHp4YO
>>734
うちでは問題ないな。

736:login:Penguin
10/07/07 10:59:15 7/lcNwPK
サーバが二つインスコされちゃってるとか?


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch