素性を導入した範疇文法について
―範疇の内部構造―
風斗 博之
範疇文法は,モンタギュー文法で用いられた統語モデルであり,統語範疇を2個ないし3個のごく限られた基本範疇の関数的な組合せで表現する。そして統語規則としては次のような一般化された関数適用規則を用いる。
範疇文法は記述のキメが荒い等の問題点があったが,筆者は次のような素性の導入を中心とした拡張をおこなってその問題を解決し,その拡張された範疇文法を用いて,英日方向の翻訳実験システム(PC98上でも作動)を試作した。
- 基本範疇を素性の集合で置き換える。
- 語順および依存関係についての情報を範疇の内部に組み込む。
- "foot feature" のように上位の構成案に次々と伝パンしていく素性を設ける。
これによって,以下の表現・構文を含め,ほとんどすべての表現に対して,単語にカテゴリーを割当て,関数適用の規則のみを統語規則として用いることで英語(および日本語)の文の解析が可能となることを示した。
仮主語・仮目的語,tough構文,主語上昇,句読点,熟語・慣用句,助動詞・補助動詞(control 関係)(日本語),サ変名詞・動詞(日本語)
"It is easy to swim." における仮主語を例にとると,"jt" に,「「準名詞句(to 不定詞・動名詞・that 節・疑問文)を左側にとる自動詞句(自動詞句=名詞句等を取って文となる表現)」("is easy" があてはまる)を右側にとって,「準名詞句を右側にとる自動詞句」("it is easy")となる」(高階の)カテゴリーを割り当てるのである。