【IT】「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正at NEWSPLUS
【IT】「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正 - 暇つぶし2ch622:名無しさん@0新周年@転載は禁止
14/06/11 17:11:38.15 BPHpaKp30
都合よくそんな間違いするかよクソどもが

623:名無しさん@0新周年@転載は禁止
14/06/11 17:15:58.02 +hdbFPVX0
PDFファイルをテキスト化するのに0CR?
普通にテキスト抽出やコピペできるような

624:名無しさん@0新周年@転載は禁止
14/06/11 18:24:21.92 N/UgsbqQ0
本書の内容で特に印象に残ったのは、閑職に追いやられた電力会社の社員が、
パソコンに向かって原発賛成世論を作り出すために2ちゃんねる等にせっせと投稿させられている、というくだり。
仕事とは言え、本当ならば悲しく哀れな話だと思った。

625:名無しさん@0新周年@転載は禁止
14/06/11 18:55:00.76 fVrzCrM7O
>>621
可愛い

626:名無しさん@0新周年@転載は禁止
14/06/11 19:10:26.57 PT4+54vq0
公的な重要な書類なのに校正もしないのかよ
何度も校正通せば絶対にひとつは見つかるしそこから全部チェックできただろう
いいかげんな規制委員会だなあ

627:名無しさん@0新周年@転載は禁止
14/06/11 19:11:19.49 xNRO62su0
高校物理を習うとv(速さ)とν(振動数)を混同することがある

628:名無しさん@0新周年@転載は禁止
14/06/11 19:27:40.24 zRg+fFq30
高校物理でν使ったっけ?fじゃねーか?
速さは大文字のVだった気もするし

629:名無しさん@0新周年@転載は禁止
14/06/11 22:11:12.21 kPF88itQ0
>>623
ネットで公開してる文書でも、
厚生労働省なんかのpdfは普通にテキストをコピペできるのに、
原子力規制委員会の報告書なんかのpdfはコピペできない
仕様になってたな。  まあ自分の所なんだからそれでも
できるはずなんだがな。

自分の所のpdfをわざわざプリントアウトしてOCR通す謎。

630:名無しさん@0新周年@転載は禁止
14/06/11 22:13:22.57 kPF88itQ0
>>628
光の振動エネルギー e=hν で使った覚えがある。 プランク定数の所。

631:名無しさん@0新周年@転載は禁止
14/06/12 00:28:06.05 9pj2iH6A0
問題を区別しような。

「ス卜口ンチウム」 は PDF へのリンクのタイトル ( html 文書 ) の中に紛れ
込んでたんだろ。たった一行分のタイトルを手で打ち込まないで OCR が吐
いたテキストの中からコピペーしたのかねー。そりゃ手抜き。まあフォント環
境によっては見ても判らんときがある。他に html の中に紛れ込んでた例が
見つからないので、ミスか出來心 ( いたづら ) であろ ミ'ω ` ミ

「原子カ」 「電カ」 の類は G o o g l e の O C R の せ い。画像 PDF または
保護指定された PDF からはテキストデータを抽出できないので、Google が
収集した PDF を仮想的に表示し、画像データを勝手に OCR でテキスト化し、
検索データベースに載せる。検索画面のダイジェストにはそう表示されるが本
文中にそんな文字列は無い。Google OCR の変換精度が低いとの苦情は
Google に言え ミ ' ω`ミ

( ※ まあ、保護 PDF をやめろよー )

632:名無しさん@0新周年@転載は禁止
14/06/12 02:39:32.26 j3uLgXp+0
なんでPDFを直接テキストにしないでOCR使うんだよ
コピーガードかけてないだろ

633:名無しさん@0新周年@転載は禁止
14/06/12 03:56:31.17 QFVFqi9m0
スカ卜口
これでオッケー

634:名無しさん@0新周年@転載は禁止
14/06/12 06:32:50.31 GnIALUPZ0
原発建設に当たって、活断層があるからと建設反対した学者さんを怒鳴りつけて、
無理矢理原発建設させたクズがいたけど、名前思い出せない、だれだっけ?

635:名無しさん@0新周年@転載は禁止
14/06/12 07:00:44.52 0zC9FJLU0
おいおい経産省はIT化推進の
片輪だぜw(総務省・経産省)
一言言おう
これや苦しい嘘

636:名無しさん@0新周年@転載は禁止
14/06/12 07:07:34.58 dj6Gj+hl0
カロ工施設
でググると・・・

637:名無しさん@0新周年@転載は禁止
14/06/12 07:12:00.91 8bEE/sivO
謝って終わり?

638:名無しさん@0新周年@転載は禁止
14/06/12 07:25:15.77 pT5HYh6f0
修正ついでにいろいろ消してんじゃね

639:名無しさん@0新周年@転載は禁止
14/06/12 07:30:34.75 UFgPTap40
そらぞらしい

640:名無しさん@0新周年@転載は禁止
14/06/12 08:32:09.09 M91qAGfz0
カムラのカもOCRのミスだったのかw
誰が信じるかってのw

641:名無しさん@0新周年@転載は禁止
14/06/12 12:07:06.26 QzIcCdjh0
いろいろ混同してる人が多いな
タグとは違い、検索インデックスは検索エンジン=グーグルが、ある程度わざと誤認識させてる。 

会議資料一覧からリンク張るには、先にpdfを上げたはず
グーグルやアドビのテキスト変換(OCR)では、誤認識は確認できず
まーOCRは設定しだいで認識率変わるけど

642:名無しさん@0新周年@転載は禁止
14/06/12 12:16:49.67 baEHIZfg0
謝って終わりって言うか
そもそも口クに謝ってさえいない


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch