読者です 読者をやめる 読者になる 読者になる

照応・照応解析まとめ|直接照応・間接照応・外界照応・ゼロ照応

論文でよく語られる単語は、あまりどこかの資料にまとまっていることもないので、調べる時に面倒なことがあります。

「照応解析」もそのひとつ。照応解析を用いた要約の研究を行った際に、照応解析について調べていたので、今回は調べていたときのメモを記事として残しておきます。

f:id:cland741953:20170219210034p:plain



「照応」とは

照応というのは、ある対象を別の表現で指示することをいいます。

「照応詞」とは

照応の表現をしている品詞のことです。ここでどの範囲の品詞を「照応詞」とするかは、各々が定義することになると思います。上の画像の例で説明すると、代名詞である「彼」が照応詞になります。

明確な照応詞としては

  • 代名詞:彼、彼女…
  • 指示詞:この、その…

があります。私は研究の時に便利なよう、「名詞」も含めて照応詞としていました。「名詞」が照応詞というのは、例えば「アメリカ」を「米」と表現している例があります。

「先行詞」とは

照応詞が指示している対象のことをいいます。上の画像の例で説明すると、照応詞「彼」が指示している「山田」が先行詞になります。

「照応解析」とは

照応解析とは「照応詞」が指示している「先行詞」を推定することです。人間が上記の2文を見れば、「彼」が「山田」を指示していることはわかります。しかし、機械の場合、そう簡単にはいきません。単純に、「照応詞の直前に出てきた名詞」を先行詞として推定してみても、もし先行詞と照応詞の距離が離れていれば(例えばその間に複数文が入ってくるなど)、推定することが難しくなります。

その推定方法には主に2つの種類があります。
①ルールに基づく点数加算方式
機械学習
ごめんなさい、ここはあまり勉強していないので、詳しくは調べてください。

4種類の照応

照応には4種類あります。

①直接照応

「直接照応」とは、文章中に該当する先行詞が明示的に記されている照応表現のことをいいます。

例:山田くんはあくびをしている。彼は眠そうだ。
「彼」が明示的に「山田くん」を指しています。

②間接照応

「間接照応」とは、文章中に該当する先行詞が明示的に表現されていない照応です。(常識などの知識を使って推論)

例:山田くんは封筒を渡された。山田くんはそれを未だ読んでいない。
「それ」は「封筒」ではなく「手紙」を指しています。

③外界照応

文章中に先行詞が存在せず、外界に存在するものを指示する照応。主に話し言葉で出てきます。

例:ねえ、あの猫可愛くない?
「あの」が、文中に存在していませんが、何かを指しています。

④ゼロ照応

指示しや主語が省略されている場合の照応。

例:山田くんはペンを買ったが、翌日(ペンを)なくしてしまった
(ペンを)が省略されています。

照応に似たもの「共参照」

「共参照」とは、ある表現が、他の表現と同じものを指しているときをいいます。その時の定義の範囲で、照応と区別する感じでしょうかね。

例:アメリカは〜。米は〜。
アメリカ=米 という具合に、名詞同士が同じものを指していることがわかります。

照応解析を行うツール「KNP」

KNPは日本語の構文解析を行ってくれるツールです。例えば、先に上げた、

山田くんはあくびをしている。彼は眠そうだ。

という文に対して次のような処理を行ってくれます。

f:id:cland741953:20170220083941p:plain

文節でまず区切って、その文節の修飾関係を示してくれます。適当に説明すると、「文節の依存関係」みたいな感じです。

美しい→山田くんは→している。
あくびを→している。

「美しい」は「山田くんは」の存在に依存しています。例えばここで「山田くんは」が無くなると、

美しい→している。

意味がわからないですよね。逆に「美しい」はなくなっても大丈夫です。

山田くんは→している。

人間としては感覚的にわかっているこれらを、自動的に算出してくれます。(もちろん機械なので間違いも存在する)

そしてKNPは照応解析も自動的に行なってくれます(厳密に言うと、共参照解析が主な照応解析になっている気がする)。

f:id:cland741953:20170220084545p:plain

すごい大量の情報が出てきました笑。今回のKNPの説明はこれくらいにして、次回はKNPの使い方なども説明しようと思います。

■参考文献
日本語文章における直接照応および間接照応の統合的解析
日本語構文・格・照応解析システム KNP

※間違い等ありましたら、教えていただけると幸いです