【中国】ビッグデータ分析で、中国政府による検閲の中身が明らかに とにかく集まろうとすると全部NG[02/03]at NEWS4PLUS
【中国】ビッグデータ分析で、中国政府による検閲の中身が明らかに とにかく集まろうとすると全部NG[02/03] - 暇つぶし2ch1:かじてつ!!φ ★
14/02/03 16:13:41.86
○ビッグデータ分析で、中国政府による検閲の中身が明らかに
 ゲイリー・キング米ハーバード大学教授に聞く

(長文のため、一部抜粋です。全文はソースをご覧下さい)

-ビッグデータ分析で最もびっくりした発見は何でしたか。

キング:1月に東京で開いた会議で、私は中国の検閲について調べた論文を発表しました。
これまでも多くの研究者が少しずつ中国政府の検閲について研究していました。たとえば、
1つの投稿を見て、それが取り下げ、あるいは抹消されるかどうか調べる、といった感じです。
細かいニュアンスを探るのは大変困難でした。しかしこれを「鳥の目」で眺めると、つまり
何百万もの投稿を同時に見たら、実際に何が起こっているのかがかなりつかめたのです。

-中国語の投稿ですか?

キング:そうです。何百万ものソーシャルメディアにおける中国語の投稿をダウンロードして、
中国政府が読んで検閲する前に入手してしまうのです。

-本当ですか。どうやってやるのですか。

キング:コンピュータで超高速でダウンロードするのです。

検閲をビッグデータで調べたケースは初めてです。私も最初は全然そんなことをする気は
なかったんです。もともとは、文章から情報を抜き出す分析手法の開発に力を注いでいました。

・中国政府より早く投稿内容を入手

そのうち我々の考え出した技術を商業化した「クリムゾン・ヘキサゴン」という会社ができた。
それで同社に「我々が開発した分析手法を試したいので、私に中国語による投稿のデータを
送ってほしい」と依頼したんです。いわゆるストレステストです。

分析手法は英語で開発したので、もし使い物になるのなら、英語とまるで違う言語でも使える
はずだと思ったのです。そして我々はクリムゾン・ヘキサゴンからソーシャルメディアの投稿や
URLを含む中国語の投稿のデータを入手しました。それを分析し、試行錯誤してみたところ、
大変うまくいきました。

そして大学院の学生たちにこう指示しました。「この投稿が載っていたウェブサイトを見に行って
確認してくれ」。私に中国語は分かりませんが、彼らは分かります。分析したテキストに広告が
含まれていないことや、そして特定の投稿だけを抜き出していないかどうかなどを確認しました。

院生が確認して、最初はクリムゾン・ヘキサゴンのデータに何やら不具合があったのだろうかと
思いました。というのも、投稿が見つかっても、投稿に書いてあったURLをクリックしてもどこにも
飛ばないというケースが多々あったからです。そこで、その投稿を中国政府が検閲したのだと
気づいた。

ということはクリムゾン・ヘキサゴンは最初に、検閲前の生情報を手にできたのです。急きょ、
研究テーマを検閲の分析に変えました。

>>2-5あたりへ続きます)

□ソース:日経ビジネス
URLリンク(business.nikkeibp.co.jp)


レスを読む
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch