辞書

Linderaは、日本語・韓国語・中国語の形態素解析のための様々な辞書をサポートしています。各辞書は個別のクレートとして提供されます。

辞書言語クレート説明
IPADIC日本語lindera-ipadic日本語で最も一般的な辞書
IPADIC NEologd日本語lindera-ipadic-neologd新語に対応したIPADIC
UniDic日本語lindera-unidic均一な単語単位定義を持つ辞書
ko-dic韓国語lindera-ko-dic韓国語の形態素解析
CC-CEDICT中国語lindera-cc-cedict中英辞書
Jieba中国語lindera-jiebaJiebaベースの中国語辞書

辞書の入手方法

ビルド済み辞書は GitHub Releases からダウンロードできます。対象言語の辞書アーカイブをダウンロードし、ローカルディレクトリに展開してください。

#![allow(unused)]
fn main() {
// ローカルパスから外部辞書を読み込む
let dictionary = load_dictionary("/path/to/ipadic")?;
}

[!TIP] 外部辞書ファイルなしの自己完結型バイナリが必要な場合は、embed-* feature フラグを使って辞書を埋め込み、embedded:// スキームでロードできます:

#![allow(unused)]
fn main() {
let dictionary = load_dictionary("embedded://ipadic")?;
}

詳細は Feature フラグ を参照してください。

各辞書クレートのドキュメントで、フォーマット詳細、ビルド手順、使用例を参照してください。