日本語の連濁現象は音韻・文法・意味面にわたってさまざまな一般化が提案されているが,例外が多く完全な予測は困難であることが知られている。従来,語彙的例外の存在を認めつつも連濁を規則に基づいた現象とする立場と,連濁は基本的に語彙的な現象であり,その適用は既知の語からのアナロジーに基づくとする立場とがある。
本発表では,memory-based learning を用いて約 1 万語の複合語について交差検定を行い,アナロジーが連濁の有無を高い確度で予測することを確かめる。とくに,共通の後部要素をもつ語からのアナロジーに頼るだけでも約 9 割の語について連濁の有無を予測できるが,音韻的特徴や品詞の一致を利用することで成績が有意に向上することを見る。
また,連濁との類似が指摘されているオランダ語の複合語における linking element との対照を行う。