日本語の形態構造は特殊?
機械翻訳には普通の単語辞書ではなく、形態素辞書が必要です。ヨーロッパの言語の形態素の構造つまり形態構造は比較的単純です。そもそも形態素という概念はヨーロッパの言語を対象として分析された結果、生み出されたものですから、分析しやすいのは当然といえます。
ところが日本語を始め、ヨーロッパの言語とは異なる構造をもった言語の場合、形態構造だけでなく、文法構造や音韻構造も分析が簡単ではありません。日本語は語幹と接辞があり、ほぼ形態素に相当することは説明しました。語幹とは簡単にすると、動詞の漢字部分、接辞は平仮名部分といえます。日本語では語形変化を活用という言い方をしますが、活用において、変化しない部分が語幹、変化する部分が接辞という理解が最も簡単です。たとえば「歩く」だと「歩」が語幹、「く」が接辞です。「歩く」は「歩か(ない)(未然形)、歩き(ます)(連用形)、歩く(終止形)、歩く(時)(連体形)、歩け(ば)(仮定形)、歩け(命令形)」のように6つの活用形がある、と習います。()内の語を補うことで、簡単に活用形を見つけ出すことができます。「歩く」の場合、「歩い(て)(連用形)」という形がありますが、これは「歩きて」が歴史的に変化したもの、という説明がなされています。これで納得されましたか?この説明方法では、五段活用の他に、変格活用という不規則な変化形があることも同時に示され、外国人だけでなく、日本人も悩みます。どの言語にも不規則変化はあるのですが、それを覚えるのは言語学習の妨げになっています。とくに「名詞+する」というタイプの動詞はけっこう多いのですが、全部サ行変格活用ということになり、例外的ではなく、普通にある不規則性ということになっています。未然形に「し、せ、さ」の3つがあって、どう使い分けるのか外国語として日本語を学ぶ人々を悩ませます。
そこで形態素という概念を用いて、日本語を再分析するとどうなるでしょうか。その前に、音韻がモーラという音節単位であることを先に解決しておかないと、形態素が音素の結合という前提がくずれてしまいます。そこでまずモーラを音素に分解することから始めるのですが、一番簡単な変換方法はローマ字で書くと、だいたい音素に対応します。「歩く」だとaruku、「分析する」はbunsekisuruのようにします。
月 | 火 | 水 | 木 | 金 | 土 | 日 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |