12/04/30 22:21:37.41
これまた、禅問答のような文ですが
URLリンク(www.sematics.co.jp)
コホモロジーで意味解析 Semantic analysis using co-homology
コホモロジーとは、もともと[ ]1と呼ばれる図形(のような)の性質を調べるために
アレクサンドル・グロタンディークが考案した計算手段です。特に有名なヴュイユ予想を
証明するための道具としても使われています。この道具を言語の意味解析をするために利
用しようと考えたわけです。それはテキスト言語の意味を抽出するには、形態素の意味概
念だけではなく、係り受けを含めた構文解析や照応解析での結束構造や文としての知識を
なす最小単位、そして文脈解析での文間関係や[ ]2、その上文章や文書としての主題や
話題に対する意味の概念が各層別に存在するためである。しかし、ただ単にそのまま利用
可能な程、言語空間もコホモロジーも簡単なものでなく、いろいろ工夫が必要になります。
言語空間を考える時、まずテキスト文書を我々は考えます。文書を集合と考えると、そ
の部分集合は文章(段落のような…)になる。その文章の部分集合が文であり、その部分
集合が連文節である。そのまた部分集合が[ ]3であり、そのまたまた部分集合が形態素
になる。形態素の部分集合が文字になり、それが文書という全体集合の要素であることは
自明なことである。ここでは意味解析を考えていくので、日本語や中国語などのように文
字自体に意味を含んでいたとしても、他言語との共通手法ということも考え、文字を最小
単位とはせず、「意味のある最小単位」である[ ]4を集合の要素とする。
上記で述べた文書から形態素までの部分集合への分割化は、視点を変えると解析学の微
分と似ています。文書をn 次元多様体と考えると、それを微分∂という概念で次元を下げ
ることによって文章になる…とする。そうすると以下も同じように形態素まで微分∂とい
う作用子(関数)で分割階層化ができる。微分積分(解析学)で習った微分の概念を集合
など別なものでも使う…というアイデアが大事です。