ヒトの言語産出とコーパスの頻度はどのくらい類似しているか

玉岡 賀津雄
木山 幸子
宮岡 弥生

新聞と小説のコーパスがヒトの言語産出とどのくらい類似しているかを,オノマトペと動詞の共起関係に焦点を当てて検討した。28種類のオノマトペを対象に,毎日新聞と青空文庫の各コーパスから共起動詞を検索し,さらにヒトの言語産出として,大学生36名に30秒で思いつく共起動詞を書かせた。この共起頻度について,出現の多様性をエントロピー,出現の一貫性を冗長度で示した。2つの指標の分散分析と多重比較の結果は,「ヒト=新聞<小説」という関係であった。頻度パターンの観点からは,新聞のコーパスはヒトの産出と類似しているが,小説のコーパスとヒトとは異なっていることが分かった。これは,新聞が大衆に情報を伝えるために簡潔な表現がとられるのに対して,小説は作家の個性が強く現れるからであろう。オノマトペと動詞の共起に限った結果ではあるが,ヒトの言語産出を一般化して論ずるには,新聞のコーパスの方がより適していると言えよう。