雪だるまプロジェクト
このサイトを検索
トップ
日本語解析システム 雪だるま
形態素の結合
複合語
表記ゆれ
代表表記
同義語
その他の特徴
品詞体系
追加モジュール
解析対象
参考:形態素と単語
システムの利用
n-gram作成ツール
表記ゆれ解消API
その他機能のAPI利用
プロジェクト
開発理念
参考資料
外部発表
長岡技術科学大学 自然言語処理研究室
Twitter
English
リンク
日本語解析システム 雪だるま
>
同義語
「赤ちゃん」と「赤ん坊」など、違う単語であるけれどほぼ同義である語は多数あります。雪だるまでは、単語とは別に「概念」という情報を持っており、概念IDを出力することで
このような「ほぼ同義」の語
(compatible words, near-synonym, quasi-synonym)を同一化することが簡単にできます。
本機能によって、「赤ちゃん」と「赤ん坊」を同一概念IDで検索することができますので、両単語の使用実態の差異を分析することも容易です。
Comments