その他の特徴

〇意味解析をしない

雪だるまでは、単語解析がすべきことと意味解析がすべきことを明確に分離します。従来の形態素解析の全てで、「名詞」と「固有名詞」(あるいは「人名」「地名」)という分類がありました。これは、「ひかり」が名詞なのか人名なのか固有名詞(新幹線の名前)なのかを形態素解析器が決めていることになり、意味解析そのものです。

以上の考えから、我々は「固有名詞」「人名」「地名」等の品詞を廃止しました。「ひかり」は名詞、単語解析器がすべきはこれだけでいいのではないかと思います。

〇曖昧さを許す

雪だるまでは、様々な部分において曖昧さを許した設計になっています。
    • 品詞 : 例えば、「通常」という単語は名詞でもありますし副詞としても使われます。このような場合、雪だるまでは「名詞|副詞」という2品詞を付与しています(「名詞|副詞」という1品詞と考えることもできます)。
Comments