【新型コロナ】新型コロナウイルス感染症(COVID-19)2万4000本以上の論文データセット、AI2などが公開at SCIENCEPLUS
【新型コロナ】新型コロナウイルス感染症(COVID-19)2万4000本以上の論文データセット、AI2などが公開 - 暇つぶし2ch1:しじみ ◆fbtBqopam767 しじみ ★
20/03/26 14:52:07 CAP_USER.net
新型コロナウイルス感染症(COVID-19)と戦う科学者を支援するため、関連する2万4000本以上の論文をまとめたデータセットが公開された。

複数の組織を横断して協力する研究者たちが、「CORD-19(COVID-19オープン・リサーチ・データセット)」を3月16日、公開した。査読済論文を掲載する学術誌と、バイオアーカイブ(bioRxiv)やメドアーカイブ(medRxiv)といったプレプリント(査読前論文)を投稿できるWebサイトなどを情報源とする、2万4000本以上の論文が含まれたデータセットだ(日本版編注:2万4000本はメタ情報。全文1万3000本以上)。新型コロナウイルス(SARS-CoV-2)や新型コロナウイルス感染症(COVID-19)、コロナウイルス属に関する研究を対象とする。現在進行中のパンデミック(世界的な流行)に関する科学文献を集めたものとして最大規模を誇り、新たな研究が発表されれば随時更新される。

同データセットは、米国科学技術政策局(Office of Science and Technology Policy:OSTP)の要請で3つの組織が協力してまとめた。米国立衛生研究所(National Institutes of Health:NIH)の国立医学図書館(National Library of Medicine:NLM)が既存の科学出版物へのアクセスを提供し、マイクロソフトは自社の文献キュレーション・アルゴリズムを使って文献を収集。非営利のアレン人工知能研究所(AI2)が、WebページやPDFの関連記事を、アルゴリズムで処理できる構造化された形式に変換した。同データセットは現在、AI2のWebサイト「セマンティック・スカラー(Semantic Scholar)」で利用可能だ。

AI2のセマンティック・スカラー・サービスは科学コミュニティが学術文献を簡単に検索できるようにするサービスである。AI2は同サービスの一環としてすでに、すべての新たな研究に適用しているものと同じ情報抽出・分析の手法でCORD-19の新たなコーパスを処理している。論文の著者や研究手法、データ、抜粋といった主な情報を抽出し、それぞれの論文が既存の研究に追加している部分をすばやく判断できるようにしている。

またセマンティック・スカラーは「エルモ(ELMo)」や「バート(BERT)」といった最新の自然言語モデルを使い、複数の論文間の類似性をマッピングする。それによって、研究者が自分の関心に基づく個人用研究フィードの作成を実現する。

科学界は今、新型コロナウイルスの拡大を防ぐため、ウイルスの性質に関する差し迫った問題に答えを出そうと寸暇を惜しんで研究に取り組んでいる。今回のデータセットは既存の研究を一か所に集めるだけでなく、自然言語処理アルゴリズムで文献の本文を検索し、知見を得やすくするのに役立つ。米国科学技術政策局はAI研究者に対し、医療コミュニティが大量の情報をすばやく検索できるようなテキストマイニングおよびデータマイニングの新手法を開発するよう広く呼びかけている。

■AI2のWebサイト「セマンティック・スカラー(Semantic Scholar)」
URLリンク(pages.semanticscholar.org)

URLリンク(www.technologyreview.jp)

2:ニュースソース検討中@自治議論スレ
20/03/26 14:58:24 yQI6j1MF.net
SARSウィルス、およびエイズウィルスとの遺伝子情報の一致はどうなった?

新型コロナウィルスは元々キクガシラ・コウモウリに寄生していたもので、
それだけでは人間に感染しないので、SARSウィルスの遺伝子の一部を取り込んで
人間に感染するようにし、さらに人間の免疫に攻撃されないようにするために、
エイズウィルスの遺伝子の一部を取り込んだ生物兵器が、新型コロナだと言う。

エイズウィルスとの遺伝情報の一致は四ヶ所ってことだけど、
そこいら辺の考察はどうなってるのか?

3:ニュースソース検討中@自治議論スレ
20/03/26 15:02:10 yQI6j1MF.net
おお、AIを使って論文を整理するのは良いことだ。
論文が2万4000本もあったんじゃ、どこに自分の欲しい情報があるのか、
全く分からないもんな。

4:ニュースソース検討中@自治議論スレ
20/03/26 15:06:13 XGRNXunJ.net
>>1
スパイク蛋白が人類の免疫を破壊している、
だから他の病気も悪くなる。

5:ニュースソース検討中@自治議論スレ
20/03/26 15:09:35 NfiyblO/.net
>>2
インド工科大学がとりさげちまった

>>4
まあ細胞にくっつく前にスパイクをなくす方法からやろう

6:ニュースソース検討中@自治議論スレ
20/03/26 15:32:16.38 xdW4DBJO.net
Al2ってなんだ?
アルミニウム中毒かなにかか

7:ニュースソース検討中@自治議論スレ
20/03/26 18:15:36 yLkgl4AT.net
>>6
えーあい

8:ニュースソース検討中@自治議論スレ
20/03/26 18:38:32.84 EL5hCA3A.net
武漢ウイルスな、武漢ウイルス

9:ニュースソース検討中@自治議論スレ
20/03/26 18:40:00.95 LgFY0FQU.net
この度の「中国政府による武漢チャンコロナウイルス拡散事件」によりシナチョンは確実に終焉を迎える…
このテロ行為で家族や仕事を失った人々の禍根は数兆億万年間続くであろう
チャンコロナ もとい 中国人が背負うべき賠償金は軽く見積もっても1000000000000000000000000000000000000000京ドルに及ぶ(笑)

10:ニュースソース検討中@自治議論スレ
20/03/26 18:58:11.08 N53OPBQB.net
おぼちゃん「論文が出たからって、まだ、その業界で広く認められたわけではない。
とりあえず、こんな結果が出た、つもりでいます。ってだけ。注意な!」

11:ニュースソース検討中@自治議論スレ
20/03/26 20:25:50 5WcXafj3.net
【天才天界】
オリンピック中止決まった次の日に、感染者の数が急にポンポンポンポンッて増えるって、
皆さんおかしいと思いませんか、俺ね物凄く違和感感じたんだよね。
だからね、もうね中止にせざるを得ないほど、東京が悪化した状態になっていて、
メディアもそれに忖度して、事実を隠し続けていた。
やっぱりオリンピック延期になった直ぐ後に、志村けんさんが感染して重症という報道が出た。
これもタイミングが良すぎませんか、皆そう思わない?
国民の神様、志村様がコロナウィルスに罹ってるのに、なぜオリンピック延期の前に報道されななかったのか。
そんなことは都知事の耳にも入ってるはずなんだよ、その頃の都知事って、五輪予定通りやりましょうって。
聖火ランナーは走っちゃうし、もう何なんだよお前らの優先順位はって話。
://youtu.be/yYz-NibusLY?t=417
sssp://o.5ch.net/1mvrd.png

12:ニュースソース検討中@自治議論スレ
20/03/26 20:43:35.79 bvBgq2Vk.net
著作権侵害でサイト閉鎖しろよ

13:ニュースソース検討中@自治議論スレ
20/03/26 21:19:09.17 dg6fnPXb.net
いつまで新型コロナとか言ってんだろうな
もう、武漢コロナによる武漢肺炎でいいだろ
もしくは、チャイナコロナによる支那肺炎

14:ニュースソース検討中@自治議論スレ
20/03/27 09:58:46.18 S1URkY6g.net
頑張れコロナファイター

15:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch