14/06/10 18:04:47.72 80OfRNg20
辞書でも難しいよ
たとえば
ユトリ口
というのをOCRが見たとき、
ユトリロと認識するか、ゆとり口と認識するかはなかなか難しい。
で、正解はユトリ口(ゆとりぐち)というビックリハウスでエビぞりと同じころに生まれた言葉なわけだが。
356:名無しさん@0新周年@転載は禁止
14/06/10 18:04:59.01 pTMSrPMZ0
>>1
>「検索避けのためにあえて漢字にしたので
これくらいGoogle先生だと検索してくれるんじゃねーの?
357:名無しさん@0新周年@転載は禁止
14/06/10 18:05:26.42 tsd2DEeHO
確認しなかったなら職務専念義務違反か?
358:名無しさん@0新周年@転載は禁止
14/06/10 18:06:39.35 L8z6IlOU0
規制委員会のやつら頭ベクレてるんちゃう?
359:名無しさん@0新周年@転載は禁止
14/06/10 18:07:46.95 lQjCQFy60
ここまでデンドロビウムなし
360:名無しさん@0新周年@転載は禁止
14/06/10 18:07:50.11 80OfRNg20
>>355
すまん、ユトリ口の正しい(とされている)読み方はたしか「ゆとりろ」だった。
361:名無しさん@0新周年@転載は禁止
14/06/10 18:09:15.06 PwMer7PM0
都合の悪い資料だけミスるOCRですねw
362:名無しさん@0新周年@転載は禁止
14/06/10 18:12:37.79 qQ1HRMP+0
>>354
>東京電力の場合、原発の事故によって言及が増えたのだから
>検索件数が多い(=誤認識の機会も多い)のは自然なことだと思うが。
それを言うんだったらまず事故対応で他電力より書類が倍以上増えていることを証明しないと。
事故ったんだからGoogleで引っかかる検索結果が多いのは当然!と馬鹿な主張してるわけではないよね?
あと貴方はまず「電力」が辞書に入っていないアプリケーションを探してくる方が先だと思いますよw
>辞書として持っていないOCRが多くある。
>今後も(一般的な)OCRの辞書に登録される可能性は低いだろうね。
363:名無しさん@0新周年@転載は禁止
14/06/10 18:14:10.74 TYrXuODW0
URLリンク(www.youtube.com)
364:名無しさん@0新周年@転載は禁止
14/06/10 18:14:35.20 Uu2OEW530
馬鹿馬鹿しいw
こんな下手な言い訳しか浮かばなかったのか
365:名無しさん@0新周年@転載は禁止
14/06/10 18:16:01.19 21vLAlAy0
そんな検索されんの嫌だったら画像にしたらいいじゃない
366:名無しさん@0新周年@転載は禁止
14/06/10 18:18:11.26 KVr5LkIO0
流石に…
もうだめなんだよな。
色々。
367:名無しさん@0新周年@転載は禁止
14/06/10 18:18:44.87 kYsl9tRm0
「あー OCR か」 と瞬時に解らない方がバカだとおもうがな。
はっきり言って、驚きだ。ネットで普通に情報発信している奴の中に、
こんなに OCR を知らぬボケナスが多かったのか。
ぼく、そんなボケナス相手に話してたのか。がっかり ミ'ω ` ''ミ
368:名無しさん@0新周年@転載は禁止
14/06/10 18:19:07.06 94xblhfD0
ここで姑息とか
本来の意味の違う馬鹿な使い方してる連中が誤字の指摘、
そんなアホウがここまで17件そのうち、まともなの使い方は2件だけってこれも放射脳かねw
369:名無しさん@0新周年@転載は禁止
14/06/10 18:21:59.24 kYsl9tRm0
>>365
その画像データを Google が勝手に OCR で読み取ってダイジェストに載せるんだよ。
自動的に大量に収集しているから修正もしない。
捜せば、「プノレ卜二ウ厶」 もありかねんよ ミ'ω ` ミ
370:名無しさん@0新周年@転載は禁止
14/06/10 18:22:52.83 5eJVgM2l0
安倍ちゃんはネ申!!
371:名無しさん@0新周年@転載は禁止
14/06/10 18:24:49.37 Qx+/rP0K0
コクソな手を使いやがる
372:名無しさん@0新周年@転載は禁止
14/06/10 18:25:41.46 YILXekfy0
>>362
東京電力 -福島 pdf …763,000件
東京電力 pdf …2,140,000 件
関西電力 pdf …542,000 件
中部電力 pdf …362,000 件
大雑把に見積もっても、倍程度の資料が増えてることは確か。
>あと貴方はまず「電力」が辞書に入っていないアプリケーションを探してくる方が先だと思いますよw
まずOCRがどう動作するか、どう辞書を用いるか、
基本的なことを勉強された方がいいと思いますよ。
「???力」と「?力??」を並べて考えてるところ見るとあまり理解されてないようなので。
373:名無しさん@0新周年@転載は禁止
14/06/10 18:27:51.15 wCi8bvPr0
>>1
こいつら自分の仕事をなんだと思ってるんだろうな?
374:名無しさん@0新周年@転載は禁止
14/06/10 18:31:53.29 vG57hco80
検索対策は別に罪じゃないだろ
375:名無しさん@0新周年@転載は禁止
14/06/10 18:37:10.31 80OfRNg20
OCRが苦しみそうなイメージの例
URLリンク(moji-yoshimura.ocnk.net)
376:名無しさん@0新周年@転載は禁止
14/06/10 18:37:28.78 /tx1TlnW0
このOCRを公表すべきだろ。
間接的ながら国民の知る権利を制限してる。
リコール対象とすべき。
377:名無しさん@0新周年@転載は禁止
14/06/10 18:39:58.55 BhElXnms0
ミスのない仕事をしなくてはならない
という意識が低いんだろうなw
些末なうっかりで済ませられる問題じゃねーぞ
どういう立場に置かれている組織なのかを考えると ありえへん失態やろ。
378:名無しさん@0新周年@転載は禁止
14/06/10 18:40:44.87 kYsl9tRm0
>>376
そんな知る権利のような事柄を怪しい外国企業 Google に頼るのもアレだとおもうが ミ ' ω`ミ
379:名無しさん@0新周年@転載は禁止
14/06/10 18:42:31.69 /tx1TlnW0
>>378
アレって何?
380:名無しさん@13周年@転載は禁止
14/06/10 18:44:36.31 orsJ6cIn0
検索対策ってことは
木寸岡さんとかもアリ?
381:名無しさん@0新周年@転載は禁止
14/06/10 18:47:50.45 kYsl9tRm0
>>377
いや、OCR の誤変換はまじで見つけ難い。
まづいきなり誤変換がむちゃくちゃ多い。人力で打ち込んだデータの比ではない。
しかたがないので 「ストロンチウム」 の 「チウム」 で一括検索して直してゆくようなことをする。
後から後からぼろぼろ見つかる。
同じ文字列が全く同じに誤変換されるわけでもない。不規則に誤変換される。
「 ニ ( かたかな )」 と 「二 ( 漢字 )」、「卜」 と 「ト」 などは、フォントによって、見ても全く区別がつかない。
エディターの文字コード表示機能などをつかって確認するしかない。
「 アーメンドクセー!!! ヾミ;ω;ミノ
まあ人の眼には同じに見えて、そのまま読めるんだからいいぢゃないか 」
と、完全に校正が終らぬまま出してしまうことが多い ミ'ω ` ミ
382:名無しさん@0新周年@転載は禁止
14/06/10 18:49:38.83 vVVNSfJj0
ID:kYsl9tRm0
恥知らずの工作員
383:名無しさん@0新周年@転載は禁止
14/06/10 18:50:34.68 vaaqAzMI0
インド人を右に
384:名無しさん@0新周年@転載は禁止
14/06/10 18:50:35.03 kYsl9tRm0
>>382
残念だが俺はエ作員だ ミ ' ω`ミ
385:名無しさん@0新周年@転載は禁止
14/06/10 18:52:27.24 i4CpBxXS0
まるで小保方のKC1
386:名無しさん@0新周年@転載は禁止
14/06/10 18:55:43.15 o2P5dRky0
これが陰謀なのかどうか
0から100の数字で誰か説明してくれ
387:名無しさん@0新周年@転載は禁止
14/06/10 18:56:19.18 hkCEdP8f0
クチはありうるが
ボクはありえない
388:名無しさん@0新周年@転載は禁止
14/06/10 18:56:37.75 4xCEgDwe0
>>299
そうやって認定厨やってればいいと思うよ。
タダでさえ叩かれてる業界のくせに情報開示をナメてるとしか思えん
あと役所は文章表現・解釈でメシ食ってるのに、こんな言い訳が通用するとでも?
お上とズブズブのクソ業界だから一般大衆なんて虫けらかゴミにしか思ってないんだろうけどな。
つか野党は格好の叩きネタが転がり込んできたんだから徹底追求しろよ。
389:名無しさん@0新周年@転載は禁止
14/06/10 18:57:51.68 Yp+vpJ3y0
わたしのスマートフォンのフォントもわかりづらいなあ
390:名無しさん@0新周年@転載は禁止
14/06/10 18:59:17.01 +35rQfEf0
OCRとその校正をやったことある人って意外に少ないんだな
391:名無しさん@0新周年@転載は禁止
14/06/10 19:05:13.81 nSJC0Y/70
>>339
税金の話をするならたかがOCRソフトを最新にする必要はないと思うが、放射脳はそんなもんに金かければ満足なのか?
まあ、この程度で検索避けされちゃう情弱には必要かもしれんが
392:名無しさん@0新周年@転載は禁止
14/06/10 19:09:15.12 vVVNSfJj0
ID:udWPYyCv0
ID:9HyIDryn0
ID:mk3gH9Eq0
ID:kYsl9tRm0
こいつら工作員
393:名無しさん@0新周年@転載は禁止
14/06/10 19:12:28.00 4R0Rg4VM0
≪ 言われたから直した ≫
394:名無しさん@0新周年@転載は禁止
14/06/10 19:13:49.90 0C7nlnRx0
韓国製だろ
395:名無しさん@0新周年@転載は禁止
14/06/10 19:16:59.88 0lpyBKYW0
工作員達の苦しい言い訳w
最初からバレたらOCRのせいにして誤魔化す気満々で故意にやったとしか思えんな。
396:名無しさん@0新周年@転載は禁止
14/06/10 19:18:25.72 Ar2u43Bc0
ユニバーサルメルカトル人類は月に行ってない速報
397:名無しさん@0新周年@転載は禁止
14/06/10 19:21:13.31 XRDeCoi40
すげー火消し工作員すぐ沸いてるのな
こいつらに行く金も結局税金か…
398:名無しさん@0新周年@転載は禁止
14/06/10 19:25:05.48 EhusRRfr0
パタリロ
パタリ口
なんか違う
「パタリロ」を「パタリ口」と読む類いでしょうか。いくらでも続くな、このネタ。 RT @uema2 「するーか」を「するーりょく」と読んでしまうんですね。よくある間違いです。 RT @Joseph307 どうでもいいんだけどスルー力をスルーカと読んでしまう。
2009年8月14日 - 4:54pm
399:名無しさん@0新周年@転載は禁止
14/06/10 19:27:22.51 YILXekfy0
そもそも本当に隠したいなら資料のタイトルを決定する段階から
ストロンチウムという単語を使わなければいいわけで
水際で小細工する必要なんて全くないんだがな。
400:名無しさん@0新周年@転載は禁止
14/06/10 19:27:36.59 HUqA6yyw0
日本の敵ながら、やるな と思ってしまったわ
401:名無しさん@0新周年@転載は禁止
14/06/10 19:28:44.14 9FoVHdlX0
参考にどのOCRソフト使ったかお兄さんに教えてもらいたい
402:名無しさん@0新周年@転載は禁止
14/06/10 19:30:39.94 vCMsYHAm0
パソコンじゃなく紙から資料作るのか?
403:名無しさん@0新周年@転載は禁止
14/06/10 19:30:54.02 elH8utWD0
>>1
検索避けか!
エリートは、こういう知恵は働くんだよなw
404:名無しさん@0新周年@転載は禁止
14/06/10 19:31:08.42 q/aysmyb0
指摘されたらそういう言い訳を用意してたんだろうな。
405:名無しさん@0新周年@転載は禁止
14/06/10 19:32:56.52 eIIvl14a0
原子力規制委員会のストロンチウムの表記
旧)2014年6月8日時点のHP
URLリンク(imgur.com)
改)2014年6月10日時点のHP
URLリンク(imgur.com)
しれっとした顔でHPが修正されている。
しかし、どちらも更新日が変わっていない。
しかも日付は2014年1月24日のまま。
OCRの読み取りにこだわっている ID:YILXekfy0がいるみたいだけど、
HPの表記にはOCRは関係ないからww
OCR変換がおかしい主張が通るのはpdfのストロンチウムのある記述内容だけでしょ。
たぶん、関係者なんだろうけどご苦労様www
406:名無しさん@0新周年@転載は禁止
14/06/10 19:34:15.63 tLC8Qaa+0
ねらーと同レベルのOCRだな
407:名無しさん@0新周年@転載は禁止
14/06/10 19:34:50.35 UQdeif6z0
OCRミスが、本当かどうか別にして
国家機関すら
2CH由来情報に即座に反応したんだから
ニチャンネラーは誇っていいと思う
408:名無しさん@0新周年@転載は禁止
14/06/10 19:35:01.70 LOd+EM690
自民党サイドの不正がばれるたびにホットリンクみたいなネット工作会社は大儲けなんだろうねw
「放射脳w」って連呼していればザクザクお金が入るもん。
409:名無しさん@0新周年@転載は禁止
14/06/10 19:37:06.01 NpO/q3Me0
でもそんなOCRソフトってあるのかな
自分の知る限りは思い当たらないけど
410:名無しさん@0新周年@転載は禁止
14/06/10 19:38:59.15 YyVOERJb0
うっかり2ch.s cに書いてしまった
検索よけで後藤久典さんを思い出しました
411:名無しさん@0新周年@転載は禁止
14/06/10 19:44:19.94 BycK34Rd0
>>404
十中八九そうだろうな
カバーストーリーは常に用意しとくのが公務員の勤めと教わった
412:名無しさん@0新周年@転載は禁止
14/06/10 19:45:14.28 d9/XiRtr0
これは悪質な故意と断定できるな
検索してヒットした報告書がヤバすぎる
413:名無しさん@0新周年@転載は禁止
14/06/10 19:46:23.37 b/+YvHbv0
また早稲田でコピペを覚えたのか
414:名無しさん@0新周年@転載は禁止
14/06/10 19:46:54.22 Ar2u43Bc0
>>405
OCRソフトでpdf作ると基本的にファイル名はヘッダから取られて、普通ヘッダは文書の見出しから取られるけど……
415:名無しさん@0新周年@転載は禁止
14/06/10 19:47:02.02 6lWkHycl0
チョン→テョン
416:名無しさん@0新周年@転載は禁止
14/06/10 19:50:42.98 vClwaTjP0
見苦しい言い訳だね
今時そんなんないでしょ
検証して処分されれば良いのに
417:名無しさん@0新周年@転載は禁止
14/06/10 19:52:39.55 4Uf18G630
OCR万能説か
418:名無しさん@0新周年@転載は禁止
14/06/10 19:53:32.76 AR8KeVCa0
検索避けかぁ姑息だなあ
419:名無しさん@0新周年@転載は禁止
14/06/10 19:54:58.74 qB4x0CKa0
もちろん言い訳は最初に考えておくものだから
420:名無しさん@0新周年@転載は禁止
14/06/10 19:56:06.14 90+Za6Qv0
""付きで本来の字より一本多いか少ない字で何かの言葉を検索すると
時々引っかかる事もある。日本→目本とかそんなので
421:名無しさん@0新周年@転載は禁止
14/06/10 19:58:18.85 jNtATujz0
暴カニ男
暴力二男
422:名無しさん@0新周年@転載は禁止
14/06/10 20:00:41.82 QB0aBa1R0
一方、googleは・・・
423:名無しさん@0新周年@転載は禁止
14/06/10 20:02:17.29 w57ha/Wa0
カタカナに取り囲まれてるのにロよりも口(クチ)を優先したり、トよりも卜(ボク)を優先するOCRのソフトは出来が悪いよなあ。
424:名無しさん@0新周年@転載は禁止
14/06/10 20:02:56.67 lwYoSmbWO
スボククチンチウム
とうきょうでんか
で検索しようぜ
425:名無しさん@0新周年@転載は禁止
14/06/10 20:04:34.62 jMjiYPmE0
うちのバカ息子でもこんなアホみたいな言い訳しないぞ………!
やべっ!うちのバカ息子将来最低でも国家公務員になれるわ、安心した
426:名無しさん@0新周年@転載は禁止
14/06/10 20:06:06.92 u88GaHys0
カタカナのカ、ト、ロは字の形を変えたらいいよ
427:名無しさん@0新周年@転載は禁止
14/06/10 20:10:09.66 ky210srp0
検索回避か?
428:名無しさん@0新周年@転載は禁止
14/06/10 20:16:30.25 B7oyz4lq0
>>19
画像から起こしたものは無理
429:名無しさん@0新周年@転載は禁止
14/06/10 20:28:43.96 JTEJ9yg90
痔民党
430:名無しさん@0新周年@転載は禁止
14/06/10 20:30:51.64 0PR7sHe6O
電気化学工業大激怒
431:名無しさん@0新周年@転載は禁止
14/06/10 20:34:21.10 0mBAvN5D0
本当に何の役にも立たない原発団体だな
もう解散でいいだろ
432:名無しさん@0新周年@転載は禁止
14/06/10 20:37:30.56 2YSrujEB0
ヵっぉぉゃっょ
433:名無しさん@0新周年@転載は禁止
14/06/10 20:40:56.31 L8z6IlOU0
頭ベクレた規制委員会に何かできるんか?こんなキチガイ仕事見せられちゃこの先任せられんわ
434:名無しさん@0新周年@転載は禁止
14/06/10 20:48:22.13 0yD3WNq80
ここ最近2chで話題にされたので
シレっと修正w
余計目立つしなw
435:名無しさん@0新周年@転載は禁止
14/06/10 20:49:18.36 Q53QVjKJ0
どうせどっかの低性能なフリーソフト使ってたんだろ
436:名無しさん@0新周年@転載は禁止
14/06/10 20:50:33.70 P/5wYBy80
ニュース速報+
【国内】原発関連文書に「検索対策疑惑」持ち上がる・・・力→カ 柏→木白 ト→卜 ロ→口
スレリンク(newsplus板)
437:名無しさん@0新周年@転載は禁止
14/06/10 20:50:50.59 NnJhYhnU0
東京地検特捜部は担当者と責任者を摘発しろよ。
でなきゃもう解散しろ役立たずの捏造集団。
438:名無しさん@0新周年@転載は禁止
14/06/10 20:51:44.17 P/5wYBy80
関連スレ
原子力規制委員会、報告書内の「ストロンチウム」に当て字を使い検索されないように工作★final
スレリンク(poverty板)
原子力規制委員会のストロンチウム当て字とDASH三瓶明雄の急性骨髄性白血病に因果関係か?
スレリンク(news板)
【OCR】東京電力の力を片仮名のカ「東京電カ」にすると… ★2
スレリンク(poverty板)
439:名無しさん@0新周年@転載は禁止
14/06/10 20:59:53.43 v1mioUj80
こんなもん力を使ってる文章でpdfなら何でも引っかかるけど
女子カでもこんなもんだけどなんの陰謀よw
URLリンク(www.google.co.jp)
440:名無しさん@0新周年@転載は禁止
14/06/10 21:01:02.92 0yD3WNq80
安倍自民の擬似戒厳令布告(癌登録法は懲役2年の罰則付き)
URLリンク(blog.goo.ne.jp)
厚生労働省がん登録の法制化、秘密漏えいは2年以下の懲役又は100万円以下の罰金
URLリンク(www.mhlw.go.jp)
【朗報】福島&福井県、IAEAとの取り決めで甲状腺癌など不安を煽るデータを秘密指定へ。
スレリンク(poverty板)
IAEAと福島、共有情報を秘密にすることで合意 原告団「IAEAは健康被害隠しの前科があり心配」
スレリンク(poverty板)
441:名無しさん@0新周年@転載は禁止
14/06/10 21:01:51.74 P/5wYBy80
>>34
違う違う。まったく逆だ!
第10回
ストロンチウム多かったけど「全件データ」より多いのはおかしいので結論出しません
第11回
「全件データ」が過小評価されてました
という経緯がある
442:名無しさん@0新周年@転載は禁止
14/06/10 21:02:37.34 GObYVjZU0
Hc1
443:名無しさん@0新周年@転載は禁止
14/06/10 21:03:30.67 GBXX+NW60
アりーナ クりフト
444:名無しさん@0新周年@転載は禁止
14/06/10 21:04:48.73 6L0oQL1O0
ニュースで見た、シナの偽装日本ブランドのおむつとか
こういう感じだったな
445:名無しさん@0新周年@転載は禁止
14/06/10 21:06:13.65 d+k/4z+Y0
下請け朝鮮人の仕事じゃねえか
446:名無しさん@0新周年@転載は禁止
14/06/10 21:08:05.68 PG4Eeh7K0
対応が素早いな
447:名無しさん@0新周年@転載は禁止
14/06/10 21:08:21.71 67JjhpyD0
シムシティで住宅地のすぐ横に原発建てたらみんな引っ越していった
クリーンエネルギーなのに
448:名無しさん@0新周年@転載は禁止
14/06/10 21:08:40.70 AZXaH42Z0
安倍晋Ξ
449:名無しさん@0新周年@転載は禁止
14/06/10 21:09:31.93 3jl2TrmcO
丁PP
450:名無しさん@0新周年@転載は禁止
14/06/10 21:11:52.37 3jl2TrmcO
福ー
福ネ止
451:名無しさん@0新周年@転載は禁止
14/06/10 21:13:00.04 rZZAkmUr0
わざとでしょ
と思われても仕方ないぐらい
これまで隠蔽や捏造をやり過ぎた
452:名無しさん@0新周年@転載は禁止
14/06/10 21:13:19.88 UBNMcmcf0
白血病の有名人・タレント・俳優・著名人
日本テレビ系の番組「ザ!鉄腕!DASH(ダッシュ)!!」の看板企画「DASH村」
で、農作業を指導してきた福島県浪江町の三瓶明雄(さんぺい・あきお)さんが6/
6、同県伊達市の病院で死去した。 (急性骨髄性白血病、84歳)、福島原発地域
の犬猫を引き取りして里親探しなどの活動を行っていたKAZUさん(急性白血病で死亡)、
俳優の渡辺 謙、女優の吉井怜、ニュースキャスターの大塚範一、歌舞伎の市川団十郎、
前宮城県知事の浅野史郎(成人T細胞白血病)、元大阪体育大浪商高野球部監
督の金藤晃裕(かねとう・あきひろ)氏が急性骨髄性白血病のため、大阪市阿倍
野区の病院で死去した。55歳。香川県出身
モデルの夏目雅子、お笑いコンビ”カンニング”の中島忠幸、歌手の本田美奈子、
写真家・山岸伸(慢性骨髄性白血病)、フォトグラファー谷
沢淳、日本ハムファイターズの岩下修一投手(白血病)、総合格闘家の宮下トモ
ヤ(白血病)、フィギュアスケート選手でのち女優のソニア・へニー(白血病)、ジョ
ゼフ・L・マッケヴィーティ(白血病)、『駅馬車』で馭者役を演じたアンディ・ディヴァ
イン、マリ・キュリー(ポーランド出身の物理学者・化学者)、カーネル・サンダー
ス (ケンタッキーフライドチキンの創業者)、住宅顕信(俳人)、チャールズ・ブコ
ウスキー(アメリカの作家)、中川勝彦 (ミュージシャン、歌手、俳優)、蔵間竜
也 (享年:42、タレント、元力士、時津風部屋)新山志保(享年:29歳、声優)
アンディ・フグ (空手家、K-1ファイター、 享年:35)、桂文治 (落語芸術協
会会長)、沢口ともみ(自衛隊出身の反戦ストリッパー)、矢野浩三郎 (翻訳家
、明星大教授)、若三梅雅裕 (大相撲間垣部屋力士、 享年:25)、西島和彦 (
物理学者、東京大学・京都大学名誉教授)、中里逢庵(陶芸家)、チカップ美恵
子 (アイヌ文様刺繍作家)、沢田としき(イラストレーター)、北野弘久 (法
学者)、正司玲児 (漫才師)、ボブ・フェラー (アメリカ合衆国の元プロ野球
選手【クリーブランド・インディアンズ所属】)、秋山義昭 (大学教授、小樽商
科大学前学長、北海学園大学法科大学院教授)、小林義武 (歴史学者【
音楽史】)、佐々木高明 (民族学者)、
453:名無しさん@0新周年@転載は禁止
14/06/10 21:15:55.67 0yD3WNq80
Googleのニュース検索 "三瓶明雄" 現在3件(1つは中国サイト)
読売新聞
URLリンク(www.yomiuri.co.jp)
DASH村「農業の達人」三瓶さん死去…84歳
さえヒットせず
日本政府検閲中 日本政府検閲中 日本政府検閲中 日本政府検閲中
454:名無しさん@0新周年@転載は禁止
14/06/10 21:17:11.32 0yD3WNq80
・患者調査 福島を除外 「被ばく隠しでは!」 東京新聞 - 一輪の花 - Yahoo!ブログ
URLリンク(blogs.yahoo.co.jp)
URLリンク(blogs.c.yimg.jp)
455:名無しさん@0新周年@転載は禁止
14/06/10 21:17:16.13 yjamEMXW0
だから人に見せるものは外注するなと…
456:名無しさん@0新周年@転載は禁止
14/06/10 21:18:08.24 Ukhwc06k0
あたまいいなw
457:名無しさん@0新周年@転載は禁止
14/06/10 21:19:59.83 S2Mfedz20
>>288
みんな知ってますけど
458:名無しさん@0新周年@転載は禁止
14/06/10 21:20:47.35 L6k7OvFf0
東電を擁護するわけじゃないが
日本語は認識難しいじゃん
お前らどのソフト使ってんの?
459:.@転載は禁止
14/06/10 21:22:09.25 NaYBPso30
可能性としては上の方から検索しても出てこないように出来ないかと打診され
しかしそんな技術もないので苦肉の作としてやったのではないかと
企業のIT関連に対する無知が引き起こす事例にほんと良く似てるw
460:名無しさん@0新周年@転載は禁止
14/06/10 21:22:27.62 TahEZrWd0
ふいんき ← なぜか変換できない
461:名無しさん@0新周年@転載は禁止
14/06/10 21:25:48.12 0f85nlHY0
OCRなら?とか*がもっと混ざってそうだけどな
462:名無しさん@0新周年@転載は禁止
14/06/10 21:28:47.53 XRCjeRtH0
頭逝かれてんな
463:名無しさん@0新周年@転載は禁止
14/06/10 21:30:21.36 ddM/ZBF70
一覧の見出しをORCで処理する意図不。本当に手打ちより速いわけないだろ
464:名無しさん@0新周年@転載は禁止
14/06/10 21:30:41.10 LAXR4+uy0
>>1
web ページのファイルタイトルもインチキになってたよ。
ocr関係ないだろ。
465:名無しさん@0新周年@転載は禁止
14/06/10 21:33:00.35 qCKfyXrO0
ばれちゃあしょうがねぇ
466:名無しさん@0新周年@転載は禁止
14/06/10 21:36:44.41 framlHv40
謝罪文で流行ってる分割PDFにしないから突っ込まれるw
467:名無しさん@0新周年@転載は禁止
14/06/10 21:37:51.42 kdd2ZHf50
pdfからそのままコピペするとこうなる。
特に古めのフリーソフトで変換したファイルとかに顕著。
468:名無しさん@0新周年@転載は禁止
14/06/10 21:40:57.16 G212mXS80
厚生労働省なんかのpdf資料はテキストを簡単に拾えるのに、
なんで原子力規制委員会の資料はプロテクトかけてるの?
469:名無しさん@0新周年@転載は禁止
14/06/10 21:55:05.43 NGsldPc00
検索されたくないだけだろ
こういう小さなウソついても信用無くすだけだ
470:名無しさん@0新周年@転載は禁止
14/06/10 21:55:57.78 A/NVTtxE0
これは前から考えてあった言い訳
471:名無しさん@0新周年@転載は禁止
14/06/10 21:57:51.99 q+4qA1ie0
よく見つけたな
472:名無しさん@0新周年@転載は禁止
14/06/10 22:02:10.11 vaa0Ism20
>>469
たしかに
473:名無しさん@0新周年@転載は禁止
14/06/10 22:05:37.02 +EH8LYAi0
TPP
と
丁PP
でも違う結果になる
474:名無しさん@0新周年@転載は禁止
14/06/10 22:07:38.70 XenH/Y8wO
スレタイ見ただけでは何が違うのか全く分からなかった
475:名無しさん@0新周年@転載は禁止
14/06/10 22:08:04.97 ZzQ5u25j0
原子力の信頼が失墜している現在、こんなミスをすると些細なことで即座に
揚げ足を取られるという教訓だ。
これを機に信頼回復に努め、心を入れ替えることだな。無理だろうけど。
476:名無しさん@0新周年@転載は禁止
14/06/10 22:08:55.59 Ih6/qz5d0
早速魚拓しておいたw
477:名無しさん@0新周年@転載は禁止
14/06/10 22:09:57.22 hpHz+GIO0
エ作板みたいなもんかw
478:名無しさん@0新周年@転載は禁止
14/06/10 22:11:07.19 Zi9m1XRi0
辞書も使わないヘッポコOCRはどこのメーカーかね
つかgoogleが対応すればいいんじゃないかね
479:名無しさん@0新周年@転載は禁止
14/06/10 22:11:18.60 ARH1/Qdx0
OCRソフトすらまともに仕えない馬鹿どもに
原発いじらせちゃ駄目だろw
まさにキチガイに刃物www
480:名無しさん@0新周年@転載は禁止
14/06/10 22:12:48.89 0yD3WNq80
>>475
隠蔽しまくってる限り信頼など無理な話だ。
→>>440 >>454
それほど深刻な事態が現れはじめてるんだろうね
481:名無しさん@0新周年@転載は禁止
14/06/10 22:13:43.48 Gl//h6w70
>>4
馬鹿過ぎワロタww
本気で言ってるのか?ww
もしかして、工作員の方ですか?ww
482:名無しさん@0新周年@転載は禁止
14/06/10 22:16:16.82 r3hFGJY50
有名人が急性白血病で死んだばっかりだしな
蓄積性のある放射性ストロンチウムには注目して欲しくなかったんだろ
483:名無しさん@0新周年@転載は禁止
14/06/10 22:23:27.31 gHHHdwXR0
加山雄三も散歩番組なんか止めれ。
ファンでもないけど気になるわい。
484:名無しさん@0新周年@転載は禁止
14/06/10 22:24:33.38 AdmHY2xE0
またひとつ、��放射脳が馬鹿であることが示されたwww
485:名無しさん@0新周年@転載は禁止
14/06/10 22:24:59.47 7CyMcsCD0
povertyのURL貼るの我慢できねえのかよ
本当にダメなやつらだw
486:名無しさん@0新周年@転載は禁止
14/06/10 22:31:41.16 M/EuhdKl0
あるあるw
金融業だけど、全部ロ座になったりしてワラタ
487:名無しさん@0新周年@転載は禁止
14/06/10 22:32:16.56 +3GyUjZZ0
単語辞書で補正しないの?
なにかのつながりで採用した糞メーカーのOCRか?
488:名無しさん@0新周年@転載は禁止
14/06/10 22:33:31.37 rU6BXgIB0
~東京電力、不祥事と隠蔽の歴史~
1978年11月2日
福島第一原発3号機で、制御棒の脱落により日本初の臨界事故が発生。2007年3月まで隠し続ける。
1989年1月1日
福島第二原発3号機で、原子炉再循環ポンプ内が破損し炉心内に多量の金属粉が流入。
1990年9月9日
福島第一原発3号機で、主蒸気隔離弁を留めるピンが壊れ、原子炉内圧力が上昇して自動停止。
1992年2月28日
柏崎刈羽原発1号機で、タービンバイパス弁の異常により原子炉が自動停止。しかし、この事故を隠蔽して行政当局に報告せず。
1992年9月29日
福島第一原発2号機で、原子炉への給水が止まりECCS(非常用炉心冷却装置)が作動する事故が発生。
1997年12月5日
福島第二原発1号機で、制御棒1本の動作不良が見つかり原子炉が手動停止された。(国際評価尺度レベル1)
2002年8月29日
原子力安全保安院が、福島第一・第二原発、柏崎刈羽原発で80年代後半から90年代前半にかけ計29件の事故を東電が改ざんしていた可能性があると発表。
2004年1月14日
地元反原発3団体が、柏崎刈羽原発管理区域内の放射性廃棄物が外に持ち出されたため近くの土壌から人工放射性物質コバルト60を検出したと発表。
2005年6月1日
福島第一原発6号機で、可燃性ガス濃度制御系流量計の入力基準改ざんがあった事実を認める。
2007年1月31日
柏崎刈羽原発1号機で、ECCSの故障偽装など定期検査時の不正が常態化していた事実を認める。
2007年4月6日
福島第二原発4号機で、制御棒駆動装置の不正交換を偽装した事実を認める。
2007年7月16日
新潟県中越地震により、柏崎刈羽原発3号機の変圧器が火災。6号機からは、使用済み核燃料プールから放射性物質を含む水が海水に流出。
同機原子炉建屋天井の大型クレーン移動用車軸2本が破断。10月21日には、7号機の原子炉建屋のコンクリート壁から放射能を帯びた水が流出していた事実が判明した。
2008年1月14日
福島第二原発3・4号機廃棄物処理建屋の、海水ポンプの配管や電動機などが破損。
489:名無しさん@0新周年@転載は禁止
14/06/10 22:34:21.75 M/EuhdKl0
>>487
自分達で設定入れないと駄目だと思われ。
ロの次が座だったら、口座にするとか。
ただ、口座は分かりやすいけど、名前とか書き方によって色んなバリエーションがあって追いつかない。
490:名無しさん@0新周年@転載は禁止
14/06/10 22:35:36.93 mObuMw8W0
>>487
一括置換する方が早い→いつまでも同じ
491:名無しさん@0新周年@転載は禁止
14/06/10 22:36:33.62 HsRsIc8R0
これはさすがに苦しい言い訳だ
492:名無しさん@0新周年@転載は禁止
14/06/10 22:37:49.82 97Dd2Km+0
>>88
>>89
これ
493:名無しさん@0新周年@転載は禁止
14/06/10 22:39:19.34 3fyZlqbP0
>>490
すげぇわかるw
しょっちゅう使うソフトじゃないしな
494:名無しさん@0新周年@転載は禁止
14/06/10 22:59:06.08 BlTdjefn0
百歩譲って説明を信じるにしても
OCRソフトも扱えないのに
原発を扱えるの?www
495:名無しさん@0新周年@転載は禁止
14/06/10 23:06:41.89 ycRoIBkq0
>>1
これには安全厨怒りの自家発電w
496:名無しさん@0新周年@転載は禁止
14/06/10 23:07:49.80 +ZZIuCSk0
三卜アナ
三トアナ
さてどちら
497:名無しさん@0新周年@転載は禁止
14/06/10 23:08:55.36 +ZZIuCSk0
新夕アナ
新タアナ
さてどちら?
498:名無しさん@0新周年@転載は禁止
14/06/10 23:09:11.64 9vm20AmH0
自民党検疫開始
499:名無しさん@0新周年@転載は禁止
14/06/10 23:16:12.29 n6CX+DTQO
ロト(ろと)の勇者かと思ったら口卜(くちぱく)の勇者だったでござる
500:名無しさん@0新周年@転載は禁止
14/06/10 23:18:31.87 rVSYm5uz0
>>495
何を言いたいのか?
OCRの限界ですで落着何だが・・・・
しかしMS-IMEの変換がどんどん酷くなるんだが何とかならんのかなー。
501:名無しさん@0新周年@転載は禁止
14/06/10 23:19:52.10 rndiVAhE0
>>11
> 普通に検索にかからなくしただけだろ
言ってやるなよ・・・
502:名無しさん@0新周年@転載は禁止
14/06/10 23:21:41.62 U+GehAof0
【IT】「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正
スレリンク(newsplus板)
503:名無しさん@0新周年@転載は禁止
14/06/10 23:23:25.38 U+GehAof0
貼るとこ間違えたorz
504:名無しさん@0新周年@転載は禁止
14/06/10 23:30:48.34 3fyZlqbP0
>>494
最近は役所が原発を扱うのか・・・
>>502
>>503
こうやって工作してるのかw
505:名無しさん@0新周年@転載は禁止
14/06/10 23:44:51.31 pdwHuouw0
>>275
表題だけってことは、本文は「すとろんちうむ」だったってこと?それなら、検索避けって説は説得力がなくなるんだが。
506:名無しさん@0新周年@転載は禁止
14/06/10 23:47:21.21 okAnjK320
へ卜O|E卜口卜
507:名無しさん@0新周年@転載は禁止
14/06/10 23:57:25.57 mejbPPiJ0
ス力卜口
508:名無しさん@0新周年@転載は禁止
14/06/11 00:05:47.54 jLBkhtwW0
詳しくないけどAdobeとかが悪いってこと?
きちんと検証して欲しいな
怪しすぎる
509:名無しさん@0新周年@転載は禁止
14/06/11 00:06:36.53 Lzh4INxU0
googleがどっちでも検索できるようにすればいいだけなのにな
何も対応しないってことはgoogleもグルなんだろう
510:名無しさん@0新周年@転載は禁止
14/06/11 00:37:47.07 LYYKIii70
今時、ヨンデココでもこんな間違いしないだろ(´・ω・`)
511:名無しさん@0新周年@転載は禁止
14/06/11 00:37:55.12 2bQcSOZg0
アフガン航空相撲?
512:名無しさん@0新周年@転載は禁止
14/06/11 00:38:38.39 lkm1XSyNI
検索除けか
作為的だね
513:名無しさん@0新周年@転載は禁止
14/06/11 00:40:14.22 6nvKFhg/0
有名企業の名前すら読み間違えるとか
そんなOCR、10年前でも存在してなかったよw
嘘つくなよ、OCRを使ったからという言い訳を予め用意しておいて
検索よけのために当て字を使っただけだろ
514:名無しさん@0新周年@転載は禁止
14/06/11 00:45:13.04 FjpkrJza0
卜が優先的に出てくるわけ無いわ。
515:名無しさん@0新周年@転載は禁止
14/06/11 00:48:12.23 sthwB3860
朝鮮電力でしたねwww
516:名無しさん@0新周年@転載は禁止
14/06/11 00:57:09.98 j9KaS+GK0
**************************************************************************************
チェルノブイリでも、最初の4年間は何も起きないように見えた
みんな事故の記憶も薄れ、「放射能なんて実はたいしたことなかったのだ」と気楽に思い始めた
4年後、低線量被曝による初めての健康被害が表面化してくる
最初の犠牲者は子供たちだった
10年間、ゆっくりと時間をかけ、被害は大人たちに拡大していく
しかし最大の悲劇は、20年後、幼少期に被曝し生殖細胞を傷つけた子供たちが出産を始めたことだった
URLリンク(livedoor.blogimg.jp)
URLリンク(blog.minouche.jp)
URLリンク(pbs.twimg.com)
**************************************************************************************
517:名無しさん@0新周年@転載は禁止
14/06/11 01:08:07.73 07E1YRGJ0
アジアのおかしな日本語Tシャツじゃあるまいし
こんなものまで最近は外人にやらせてるのか?
518:名無しさん@0新周年@転載は禁止
14/06/11 01:13:55.48 d/psKnJOO
他の省庁も同じようなミスが起きてるの?
519:名無しさん@0新周年@転載は禁止
14/06/11 01:17:34.10 tyYZ6Uca0
>>518
探せばあると思うけど、誰も興味ないから探さない。
520:名無しさん@0新周年@転載は禁止
14/06/11 01:29:52.66 ZGVZ+CKs0
>>133
URLリンク(www.amazon.co.jp)
521:名無しさん@0新周年@転載は禁止
14/06/11 01:33:49.79 U9QK2Vwu0
これ検索避けなら相当悪質な事例なんだけど
PCにあまり詳しくない人らには
「ストロンチウム」→「ス卜口ンチウム」の文字入れ替えが
どれほど悪質な隠蔽かってことすら
なかなか理解できないところがさらに悪質だよね
522:名無しさん@0新周年@転載は禁止
14/06/11 02:25:42.86 b/EeWr710
>>521
PC に詳しい人は、そういう例が多くありすぎて 「またか」 としか想わんが ミ ' ω`ミ
523:名無しさん@0新周年@転載は禁止
14/06/11 02:33:54.99 13flfMcK0
検索エンジンの誤検知って話だったじゃないか
PDFばっかり拾ってくるのもその症状のひとつとか
「原子カ」(力じゃなくてカ)で検索かけたらぞろぞろPDF引っかかるぞ
「火カ」でもPDFが捕まる
524:名無しさん@0新周年@転載は禁止
14/06/11 02:39:36.90 z1WG3IUW0
自民党のスポンサー、経団連
あっ・・・(察し
新会員紹介:グーグル (2012年6月号) | 月刊 経団連
URLリンク(www.keidanren.or.jp)
525:名無しさん@0新周年@転載は禁止
14/06/11 02:40:29.20 wuY5Ispl0
検索回避って半端もんのヲタの妄想だわな。
その程度ならstringency の範囲でGoogle先生が Did you mean... で拾って来るわいな。
526:名無しさん@0新周年@転載は禁止
14/06/11 02:43:08.42 sh+2DCnz0
朴らの
527:名無しさん@0新周年@転載は禁止
14/06/11 02:43:28.39 4tL6/o7p0
やっぱオリジナルが間違ってたのかw
作為的だな
528:名無しさん@0新周年@転載は禁止
14/06/11 02:45:54.65 uYpDOP9Q0
>>5
印刷製版現場で働いてるが、普通によくあることだったりする
529:名無しさん@0新周年@転載は禁止
14/06/11 02:49:23.61 uYpDOP9Q0
補足しとくと、役所やらが使ってるソフトって
ふつうの民間の人が考える数バージョンは古いケースがある
そのせいかしらんが官公庁からくるテキストは
ものすごく精度があやしいことは実際によくある
530:名無しさん@0新周年@転載は禁止
14/06/11 02:50:11.15 0LtlZaGj0
原発村は信用できないけど
多分OCRミスだわ
原発関係ないのも含めて、
さっきいろいろ他の官庁のpdf資料幾つか読んでたんだけど
機密でもなんでも無い一般用語に、いらん半角スペースとか、濁点が一文字分になってるとか、コピペだととか得ないレベル。
Acrobat代ケチってるのか、
最新MSOFFICEでPDF保存できるのをしらんのか
531:名無しさん@13周年@転載は禁止
14/06/11 02:50:31.47 fKLn0P/LI
文字打ちも出来ないバカは
古舘や犬HKんトコだけではないらしいなw
532:名無しさん@0新周年@転載は禁止
14/06/11 02:51:30.39 wuY5Ispl0
まあ、日本語/漢字かなのOCRをお試し版でもいいから一度でも
使ってみなよ。Acrobat pro でもAbbyy でも 読んでココ、でもいいから。
生変換の後のチェックのがどんだけめんど臭いかと小一時間。
533:名無しさん@0新周年@転載は禁止
14/06/11 02:52:52.16 b/EeWr710
>>523
そういう文書はたいてい本文にいくつも 「原子力」 「火力」 を含むので
一つや二つが 「原子カ」 「火カ」 になっていても検索に引っかかる。
画像 PDF、保護 PDF を Google が勝手に OCR でテキスト化していることを知ってる人は
キーワードを換えて何度も検索するのでほぼ必ず引っかかる。問題無い ミ'ω ` ミ
534:名無しさん@0新周年@転載は禁止
14/06/11 02:56:26.38 b/EeWr710
だいたい 「ストロンチウム」 で検索する奴はヌルい。
通は 「90Sr」 または 「Sr90」 で検索する。
元素記号が全くつかわれてないような文書は 「おはなし」 であって
読んでも大した情報が得られないと知っているからだ ミ'ω ` ミ
535:名無しさん@0新周年@転載は禁止
14/06/11 02:58:49.17 k8TJPK6Q0
読み上げソフトに掛けたら
「ハラコカ」とか「スボククチンチウム」とか笑えるんだろうな
536:名無しさん@0新周年@転載は禁止
14/06/11 03:02:11.64 wuY5Ispl0
あと、PDFに無意味にプロテクト掛けるあほをどうにかして欲しいわ。
文字抽出禁止とか、甚だしいのは印刷禁止とか、無駄なことを。
手間焼かせんなと申し上げたい。
537:名無しさん@0新周年@転載は禁止
14/06/11 03:07:36.34 ndcf5fgE0
ザンギュラのスーパーウリアッ上
538:名無しさん@0新周年@転載は禁止
14/06/11 03:13:09.46 b382mHL/0
おとといDLした原子力規制委員会のpdfをOCRにかけてみたが
s.Typist 、読取革命は正常に認識した
読んdeココは持ってるがインスコしてなくて面倒なのでやってない
いったいどんなソフトを使ったら漢字の力がカタカナにカになるんだ?
539:名無しさん@0新周年@転載は禁止
14/06/11 03:15:37.64 b/EeWr710
>>538
ここで問題になってるのは Google が勝手に OCR にかけてることだが ミ ' ω`ミ
540:名無しさん@0新周年@転載は禁止
14/06/11 03:24:09.15 K7SDaJvu0
スボククチチウムだけかと思ったら
こんなにワンサカ出てきたね。呆れた。
検索よけにわざとやってるとしか思えんね。
541:名無しさん@0新周年@転載は禁止
14/06/11 03:26:00.91 wuY5Ispl0
が、しかし、EvernoteのOCRはかなり優秀。活字の漢字かなも、てがきのえいぶんも、かなりいいかんじ。
542:名無しさん@0新周年@転載は禁止
14/06/11 03:29:14.76 b/EeWr710
>>540
Google が検索よけするのか? ミ ' ω`ミ
543:名無しさん@0新周年@転載は禁止
14/06/11 03:32:13.93 d4oJT/R+0
OCRの読み間違いは、癖があるから、それがわかっていればチェックできる。
かなりいい加減なやつが担当しているのは事実だろうな。
544:名無しさん@0新周年@転載は禁止
14/06/11 03:32:40.35 K7SDaJvu0
マスゴミはだんまりなんだろうね。
普通なら大スクープなのに。
ほんとに日本の糞ゴミは腐ってるな。
545:名無しさん@0新周年@転載は禁止
14/06/11 03:48:40.28 TbP9Phpf0
となりの卜卜口
546:名無しさん@0新周年@転載は禁止
14/06/11 03:51:01.30 YGyM3g5U0
民主党の「マ二フェス卜」
誰も覚えてないのか・・・
547:名無しさん@0新周年@転載は禁止
14/06/11 03:54:32.70 Psstmo3J0
外ゥスレかよ
548:名無しさん@0新周年@転載は禁止
14/06/11 03:56:52.02 p46z3EP20
「放射脳」って言葉使うのは東電工作員な
549:名無しさん@0新周年@転載は禁止
14/06/11 05:29:30.41 iU8oFMf00
意図的な隠蔽工作
→ 発覚
→ 原因調査 (形式的)
→ 嘘の報告 (本当の原因はわかっているが公表できない)
→ 普通なら炎上する事態を政治力で阻止
よくある話です
550:名無しさん@0新周年@転載は禁止
14/06/11 05:41:42.08 cy8fwPin0
OCRなんか認識率上げるのに辞書で訂正掛けるんだから、こんな変換ありえないだろ。
あまりに嘘くさい説明だ。
551:名無しさん@0新周年@転載は禁止
14/06/11 05:52:48.50 kFHL7zr10
>>544
ほんとおかしいよね。
552:名無しさん@0新周年@転載は禁止
14/06/11 07:05:53.54 IB8XXICG0
これは嘘
経産省ってITの先端だぜ。
添削する時は印刷して検討するが
修正はPCで上で行う。
で。。だいたいアドビプロで変換するので
OCRソフトの介在する部分なんか無いよ
553:名無しさん@0新周年@転載は禁止
14/06/11 07:15:32.30 sbZWU34w0
OCRってちっとも進歩しないよね。
未だに買いたいと思うソフトウェアない
554:名無しさん@0新周年@転載は禁止
14/06/11 07:15:54.09 RY5ijszR0
>>4
よう、原発片付けて来いよw
555:名無しさん@0新周年@転載は禁止
14/06/11 07:18:45.15 8HqKZdeC0
少なくとも使用したOCRとバージョンくらい示さないとね
556:名無しさん@0新周年@転載は禁止
14/06/11 07:27:02.15 B03092qZ0
ワープロデーターで訂正すりゃいいだけだろ
こんな阿呆な馬鹿が、原子力を扱ってるのか
また事故が起きるぞ
557:名無しさん@0新周年@転載は禁止
14/06/11 07:32:46.62 CHjM6SDY0
スレタイ見てこのコピペみたいな事かと思ったら違った
休み時間ヒマだったので、上司のパソコンに
「うんゆ」→「運輪」
「こくどこうつうしょう」→「国土文通省」
「せんじつは」→「先曰は」
「けっさん」→「抉算」
「ねんどまつ」→「年度未」
「しゃちょう」→「杜長」
「おくえん」→「憶円」
などを辞書登録しておいた。
辛いまだバレていないようだ
558:名無しさん@0新周年@転載は禁止
14/06/11 07:34:49.27 b/EeWr710
OCR つかわんでも時々誤字はあるはな。
OCR だから同じ形の字が選ばれたというだけのことだはな。
"ス卜口ンチウム" ( 引用符つき ) で検索しても PDF は 4 個しか出ないはな。
うち 3 つは Google が拾った PDF が保護ファイルでテキストを抽出できないからと、
勝手に OCR をかけてデータベースに加えたもの。
Google のせいでネット上には 10 年ほど前からこの種の文字列がわらわらはびこって
たんだが、今まで気づかなかった人がこんなに多いとはねえ‥‥
ネットにアクセスして何やってたんだか ミ'ω ` ミ
559:名無しさん@0新周年@転載は禁止
14/06/11 07:37:08.66 b/EeWr710
>>557
それら、ほとんどあるとおもうぞ ミ ' ω`ミ
文通省は見つけた。下の方の 「お問い合わせ」 の部分、な。
URLリンク(www.mlit.go.jp)
他もほとんどあるだろ。
560:名無しさん@0新周年@転載は禁止
14/06/11 07:39:27.85 SQVxjGwf0
担当がクサチュー語の話者だった説
561:名無しさん@0新周年@転載は禁止
14/06/11 07:46:47.58 iwC04BlH0
>>559
本当だww
結構あるんだな
562:名無しさん@0新周年@転載は禁止
14/06/11 08:02:29.51 tkRfxDSz0
>>4
検索で引っかからないように、わざとやったらしいよ。
563:名無しさん@0新周年@転載は禁止
14/06/11 08:02:56.14 aJbBTPOC0
行政がこんなんだから国民から信用されないんだよ。原発の健康被害、景気の展望や年金支給、自殺者の減少、消費税の増税判断。だから
出来るだけ期待せず金使わない。テレビしかなかった時代の方法はもう通用しない
564:名無しさん@0新周年@転載は禁止
14/06/11 08:07:54.25 WiOoQMfX0
自民党の指示での隠蔽工作なんだろうな
565:名無しさん@0新周年@転載は禁止
14/06/11 08:13:44.27 uGehCWD10
知ってて放置プレイは直ちにだね
566:名無しさん@0新周年@転載は禁止
14/06/11 08:15:02.37 JfeQUo9Z0
>>552
アドビプロでOCRしたんじゃね?
567:名無しさん@0新周年@転載は禁止
14/06/11 08:15:47.63 Dwq8QHAE0
まじでこんなカスどもに原発任せてられるのかね
568:名無しさん@0新周年@転載は禁止
14/06/11 08:19:17.00 qJOTdp4A0
漢字の卜なんて滅多に使わない文字なのに、
OCRがこんな文字使っちゃうの?
信じられないなー。
569:名無しさん@0新周年@転載は禁止
14/06/11 08:20:18.09 ZfVSGZfG0
多分、東電幹部の指示か規制庁幹部の悪知恵
この程度なら与党にお伺いをしなくても独断で実行できそうだから。与党主導ならそもそも資料を出さないと思う
570:名無しさん@0新周年@転載は禁止
14/06/11 08:22:30.46 Y0n0YRUN0
OCRソフトが工作員だったとは・・・
571:名無しさん@0新周年@転載は禁止
14/06/11 08:22:47.02 Sxw/CVT/0
>>13
こんなの必死に擁護するお前がキチガイ
それとも利権共有者か?
572:名無しさん@0新周年@転載は禁止
14/06/11 08:25:30.73 Sxw/CVT/0
やっとニュースになったな
これで再稼働とかw
こんな隠蔽ごまかし責任逃れが常態化してる連中にあんな危険な物任せられるわけないだろ。
573:名無しさん@0新周年@転載は禁止
14/06/11 08:28:48.34 kZTEZACL0
全く意味の通らないおかしな文章に成らないで
当て字で意味が通るように変換してるってある意味
優秀なOCRソフトだなw
574:名無しさん@0新周年@転載は禁止
14/06/11 08:32:02.18 6+mLD/yC0
糞OCR使っただけで政府の陰謀扱いかよw
575:名無しさん@0新周年@転載は禁止
14/06/11 08:32:02.03 GrwQN0P60
> 原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていると指摘され
↓指摘した奴ら
スレリンク(poverty板)
576:名無しさん@0新周年@転載は禁止
14/06/11 08:36:36.02 VaIFPzin0
かなり都合が悪いらしいな
577:名無しさん@0新周年@転載は禁止
14/06/11 08:38:08.83 Pl3UYITp0
どうせまた中国にオフショアした結果だろ。
アイツ等、漢字を生み出した国なのに
意味よりも見た目で書くのな。
まぁその結果が先の消えた年金問題を引き起こしたんだが
うやむやにして誰も責任取らないだろう
578:名無しさん@0新周年@転載は禁止
14/06/11 08:38:48.69 OnhWgY9g0
>検索避けのためにあえて漢字にしたのでは」などと一部ネットユーザーの間で騒ぎになっていた。
当たりでしょ
579:名無しさん@0新周年@転載は禁止
14/06/11 08:40:42.20 25qtr2dE0
OCRって単純な数字すら隣の文字と組み合わせちまう印象だけど
他にもエラーたくさんあるんじゃないか
580:名無しさん@0新周年@転載は禁止
14/06/11 08:41:49.65 ZDKKrhLH0
ブサヨまた負けてしまったん?
581:名無しさん@0新周年@転載は禁止
14/06/11 08:42:02.72 tpqXJ84F0
>>1
>同庁サイトのHTMLにほかに同様な間違いがないかチェックしたところ、見つからなかったという。
ストロンチウムだけ狙い撃ちじゃねーかw
582:名無しさん@0新周年@転載は禁止
14/06/11 08:53:08.50 xVCdfruR0
これ見つけてくれた人に感謝。
こんな姑息な事までしてるとは思わなかったわ。
よっぽど都合悪いんだなw
583:名無しさん@0新周年@転載は禁止
14/06/11 09:10:58.03 Ia+R4ol+0
OCRが馬鹿なのは仕方ないし、よく似ているから目視で見落とすのも仕方ない、というか目視だと普通に読めてしまうから
このデータのアドレスを知っている人には間違っていても特に問題はない、サイト内のリンクをたどれば見れるわけだし
他社の提供する検索サービスをサイトマップ代わりするなんて普通はしないだろ、
サイト内にちゃんとそれぞれのデータへのリンクが有って内容は人間が目視で読める。なら多少誤字があってもいいじゃない
他社の検索サービスなんて関係ないし人間が見て読んだままの言葉で検索した際に候補に上がらないのは
そのような誤字があることも想定した検索エンジンを造らないグーグルの怠慢
584:名無しさん@0新周年@転載は禁止
14/06/11 09:24:01.64 PzLBHVWg0
木白崎刈谷原発とかどんだけ都合の良いOCR
585:名無しさん@0新周年@転載は禁止
14/06/11 09:40:19.67 GkdB98X30
>>25
だってあれは自作自演じゃん
日本人なら100%あんな書き方にはならない
586:名無しさん@0新周年@転載は禁止
14/06/11 09:46:03.77 0w2y0q6H0
つか、この程度なら今の検索エンジンなら拾われるんじゃね?
587:名無しさん@0新周年@転載は禁止
14/06/11 09:53:13.21 I1X2DToC0
これはもう再現実験を公開するしかないよ
そのくらいしないと疑いは深まるばかりだし
同じ条件でやれば簡単だろ?
588:名無しさん@0新周年@転載は禁止
14/06/11 10:05:05.21 7u7yNZ8YO
>>1
今来た用
【速報】原子力規制委員会、報告書内の「ストロンチウム」に当て字を使い検索されないように工作
スレリンク(poverty板)
原子力規制委員会、報告書内の「ストロンチウム」に当て字を使い検索されないように工作★2
スレリンク(poverty板)
原子力規制委員会、報告書内の「ストロンチウム」に当て字を使い検索されないように工作★final
スレリンク(poverty板)
589:名無しさん@0新周年@転載は禁止
14/06/11 10:05:10.99 708jqFrr0
発想とか手段が日本人になりすます人たちに似ている
590:名無しさん@0新周年@転載は禁止
14/06/11 10:06:58.83 6vZmiqic0
そんなミスがあるかボケ
591:名無しさん@0新周年@転載は禁止
14/06/11 10:42:31.91 dC08KMWT0
こんな単純なミスに気がつかない連中が原子力規制委員会など務まるわけがない
と感じるのは俺だけだろうか・・・・
592:名無しさん@0新周年@転載は禁止
14/06/11 11:04:09.65 4TuuzY7Q0
ミスも何も、これは故意にやったんだろ、
事故の時も、PDFで発表せず生データを出せと言っても、
PDFにこだわった連中だ、
593:名無しさん@0新周年@転載は禁止
14/06/11 11:12:47.98 NPCtJ4cf0
水銀 コバルト カドミウム 鉛 硫酸 オキシダン シアン マンガン バナジウム クロム カリウム ストロンチウム
上記の文字列で検索すると、普通のケミカルサイトよりも先にゴジラ映画が…
594:名無しさん@0新周年@転載は禁止
14/06/11 11:25:16.22 7Jvjb/Ev0
OCRソフトメーカー「風評被害だ!」
595:名無しさん@0新周年@転載は禁止
14/06/11 11:32:40.41 c3maaqa30
陰謀だと感じる人は
安保反文寸
原発反文寸
で、検索やれば?中核派だって中木亥派で入れれば出てくるよ。
PDFの検索とは、そういうもの。
596:名無しさん@0新周年@転載は禁止
14/06/11 11:33:50.46 R+6eIJCU0
中国人使ってんのかと思ったらOCRか
良かった良かった
597:名無しさん@0新周年@転載は禁止
14/06/11 11:34:03.72 bWslrQYT0
まぁこれはミスじゃないの
さすがにこれがなにかの陰謀ってことは
598:名無しさん@0新周年@転載は禁止
14/06/11 11:38:47.01 N75Byg3Q0
二ーベルソグソの指輪
599:名無しさん@0新周年@転載は禁止
14/06/11 11:40:51.04 WRKBCT63I
こんな事にまで脊髄反射でスレたてるのは
どうなのよ。
600:名無しさん@0新周年@転載は禁止
14/06/11 11:45:38.83 pglrnvXZ0
スボククチンチウム
601:名無しさん@0新周年@転載は禁止
14/06/11 11:56:13.42 Sxw/CVT/0
>>597
何かの間違いにしては多すぎ
602:名無しさん@0新周年@転載は禁止
14/06/11 12:15:56.09 1B7gd4qKi
おらにカを分けてくれ!!
603:名無しさん@0新周年@転載は禁止
14/06/11 13:54:30.60 UAlctJ8O0
こういうのって検索避けじゃないのかよwww
604:名無しさん@0新周年@転載は禁止
14/06/11 14:32:22.41 Vm767hev0
検索避けになってないのに検索避けってw
605:名無しさん@0新周年@転載は禁止
14/06/11 14:40:16.40 4SBkqtid0
OCRのミスで「ストロンチウム」→「ス卜口ンチウム」はあるかもしれないが、
→「ストロソチウム」だったら故意犯だと思うよ。
606:名無しさん@0新周年@転載は禁止
14/06/11 14:51:11.71 3yLxMK2U0
お前ら、OCRじゃねーよ、「ゼロシーアール」だよ
607:名無しさん@0新周年@転載は禁止
14/06/11 14:53:14.25 4SBkqtid0
OCRの変換精度は最終的には辞書によるんで、
辞書設定をオフるとこんな感じの変換になる。
「東京」や「電力」さえミスるとなると標準辞書もオフってないかなぁ。
608:名無しさん@0新周年@転載は禁止
14/06/11 15:01:37.13 zRg+fFq30
>>607
辞書追加ならわかるが初期設定以外で使う理由が思いつかないが?
609:名無しさん@0新周年@転載は禁止
14/06/11 15:02:06.60 ACKlehk+0
文字認識(OCR)ソフトは
チョン製?
610:名無しさん@0新周年@転載は禁止
14/06/11 15:39:47.08 t7/KGu2i0
原燃時代からそうだけど、一部誤解などもあったかもしれないが、
せこい隠蔽で何度も批判されてるから、またかよって感じが強いんだよね。
611:名無しさん@0新周年@転載は禁止
14/06/11 15:42:48.14 matVxMFc0
今どきのOcRならこんな変換にならないと言っている方々、
ぜひおすすめのOCRと機材環境をおしえてくれ。
昔のA4書類をテキスト化するのに疲れたよ。
Ocrはクソ変換だし。結局手入力したほうがはやいし。
ぜひとも頼む。
612:名無しさん@0新周年@転載は禁止
14/06/11 16:00:59.31 f9ZcyYJ40
プル卜ニウムでも検索できるなw意図的だね
613:名無しさん@0新周年@転載は禁止
14/06/11 16:06:49.78 2gxeW5+J0
おいおい、2chみたいなことやってるのか?ww
口はまだしもトなんて漢字なかなか使わないだろww
614:名無しさん@0新周年@転載は禁止
14/06/11 16:16:14.75 rmnPGOzH0
トト卜ロロ口□、馬鹿w
615:名無しさん@0新周年@転載は禁止
14/06/11 16:24:24.98 Ak9jN/vE0
千円が干円になってる文書を見た記憶がある
616:名無しさん@0新周年@転載は禁止
14/06/11 16:26:57.22 zRg+fFq30
>>611
手入力が早いなら手入力でいいんじゃないか?
あとPDFからわざわざプリントアウトしてOCRでまた読み込むなんて
あほな二度手間をかけるようなやり方は真似しちゃだめだよ。
617:名無しさん@0新周年@転載は禁止
14/06/11 16:28:24.61 A1fqkPCz0
福島原子カで検索すると色々出るねえ
618:名無しさん@0新周年@転載は禁止
14/06/11 16:43:51.92 uAekWQHZ0
OCRがストロンチウムという単語を持ってないとしても前後をカタカナに挟まれた不明な単語を同型の漢字にしちゃうってよっぽど頭の悪いソフトだな。公開しても良いレベル。
619:名無しさん@0新周年@転載は禁止
14/06/11 17:04:41.26 E4/F56IY0
これ政府がチョンじゃねーか?
620:名無しさん@0新周年@転載は禁止
14/06/11 17:07:08.68 vGWNs4BP0
またトン電カ
621:名無しさん@0新周年@転載は禁止
14/06/11 17:09:25.74 0AwqR4sF0
0CR(笑)
牛乳パックの「開け口」の表示を「あけろ」と読むようなものか?
622:名無しさん@0新周年@転載は禁止
14/06/11 17:11:38.15 BPHpaKp30
都合よくそんな間違いするかよクソどもが
623:名無しさん@0新周年@転載は禁止
14/06/11 17:15:58.02 +hdbFPVX0
PDFファイルをテキスト化するのに0CR?
普通にテキスト抽出やコピペできるような
624:名無しさん@0新周年@転載は禁止
14/06/11 18:24:21.92 N/UgsbqQ0
本書の内容で特に印象に残ったのは、閑職に追いやられた電力会社の社員が、
パソコンに向かって原発賛成世論を作り出すために2ちゃんねる等にせっせと投稿させられている、というくだり。
仕事とは言え、本当ならば悲しく哀れな話だと思った。
625:名無しさん@0新周年@転載は禁止
14/06/11 18:55:00.76 fVrzCrM7O
>>621
可愛い
626:名無しさん@0新周年@転載は禁止
14/06/11 19:10:26.57 PT4+54vq0
公的な重要な書類なのに校正もしないのかよ
何度も校正通せば絶対にひとつは見つかるしそこから全部チェックできただろう
いいかげんな規制委員会だなあ
627:名無しさん@0新周年@転載は禁止
14/06/11 19:11:19.49 xNRO62su0
高校物理を習うとv(速さ)とν(振動数)を混同することがある
628:名無しさん@0新周年@転載は禁止
14/06/11 19:27:40.24 zRg+fFq30
高校物理でν使ったっけ?fじゃねーか?
速さは大文字のVだった気もするし
629:名無しさん@0新周年@転載は禁止
14/06/11 22:11:12.21 kPF88itQ0
>>623
ネットで公開してる文書でも、
厚生労働省なんかのpdfは普通にテキストをコピペできるのに、
原子力規制委員会の報告書なんかのpdfはコピペできない
仕様になってたな。 まあ自分の所なんだからそれでも
できるはずなんだがな。
自分の所のpdfをわざわざプリントアウトしてOCR通す謎。
630:名無しさん@0新周年@転載は禁止
14/06/11 22:13:22.57 kPF88itQ0
>>628
光の振動エネルギー e=hν で使った覚えがある。 プランク定数の所。
631:名無しさん@0新周年@転載は禁止
14/06/12 00:28:06.05 9pj2iH6A0
問題を区別しような。
「ス卜口ンチウム」 は PDF へのリンクのタイトル ( html 文書 ) の中に紛れ
込んでたんだろ。たった一行分のタイトルを手で打ち込まないで OCR が吐
いたテキストの中からコピペーしたのかねー。そりゃ手抜き。まあフォント環
境によっては見ても判らんときがある。他に html の中に紛れ込んでた例が
見つからないので、ミスか出來心 ( いたづら ) であろ ミ'ω ` ミ
「原子カ」 「電カ」 の類は G o o g l e の O C R の せ い。画像 PDF または
保護指定された PDF からはテキストデータを抽出できないので、Google が
収集した PDF を仮想的に表示し、画像データを勝手に OCR でテキスト化し、
検索データベースに載せる。検索画面のダイジェストにはそう表示されるが本
文中にそんな文字列は無い。Google OCR の変換精度が低いとの苦情は
Google に言え ミ ' ω`ミ
( ※ まあ、保護 PDF をやめろよー )
632:名無しさん@0新周年@転載は禁止
14/06/12 02:39:32.26 j3uLgXp+0
なんでPDFを直接テキストにしないでOCR使うんだよ
コピーガードかけてないだろ
633:名無しさん@0新周年@転載は禁止
14/06/12 03:56:31.17 QFVFqi9m0
スカ卜口
これでオッケー
634:名無しさん@0新周年@転載は禁止
14/06/12 06:32:50.31 GnIALUPZ0
原発建設に当たって、活断層があるからと建設反対した学者さんを怒鳴りつけて、
無理矢理原発建設させたクズがいたけど、名前思い出せない、だれだっけ?
635:名無しさん@0新周年@転載は禁止
14/06/12 07:00:44.52 0zC9FJLU0
おいおい経産省はIT化推進の
片輪だぜw(総務省・経産省)
一言言おう
これや苦しい嘘
636:名無しさん@0新周年@転載は禁止
14/06/12 07:07:34.58 dj6Gj+hl0
カロ工施設
でググると・・・
637:名無しさん@0新周年@転載は禁止
14/06/12 07:12:00.91 8bEE/sivO
謝って終わり?
638:名無しさん@0新周年@転載は禁止
14/06/12 07:25:15.77 pT5HYh6f0
修正ついでにいろいろ消してんじゃね
639:名無しさん@0新周年@転載は禁止
14/06/12 07:30:34.75 UFgPTap40
そらぞらしい
640:名無しさん@0新周年@転載は禁止
14/06/12 08:32:09.09 M91qAGfz0
カムラのカもOCRのミスだったのかw
誰が信じるかってのw
641:名無しさん@0新周年@転載は禁止
14/06/12 12:07:06.26 QzIcCdjh0
いろいろ混同してる人が多いな
タグとは違い、検索インデックスは検索エンジン=グーグルが、ある程度わざと誤認識させてる。
会議資料一覧からリンク張るには、先にpdfを上げたはず
グーグルやアドビのテキスト変換(OCR)では、誤認識は確認できず
まーOCRは設定しだいで認識率変わるけど
642:名無しさん@0新周年@転載は禁止
14/06/12 12:16:49.67 baEHIZfg0
謝って終わりって言うか
そもそも口クに謝ってさえいない