インストール

cargo経由でインストール

cargo経由でバイナリをインストールできます:

% cargo install lindera-cli

GitHub Releasesからダウンロード

または、以下のリリースページからビルド済みバイナリをダウンロードすることもできます:

辞書の入手

Lindera はバイナリに辞書を同梱していません。GitHub Releases ページからビルド済み辞書を別途ダウンロードする必要があります:

# 例: IPADIC 辞書のダウンロードと展開
% curl -LO https://github.com/lindera/lindera/releases/download/<version>/lindera-ipadic-<version>.zip
% unzip lindera-ipadic-<version>.zip -d /path/to/ipadic

CLI 使用時に辞書パスを指定します:

% lindera tokenize --dictionary /path/to/ipadic "関西国際空港限定トートバッグ"

ソースからビルド

辞書なしでビルド(デフォルト)

辞書を埋め込まず、トークナイザーとトレーナーのみを含むバイナリをビルドします:

% cargo build --release

全機能を含めてビルド

% cargo build --release --all-features

辞書埋め込みビルド(上級者向け)

辞書をバイナリに直接埋め込みたい上級者向けに、embed-* feature フラグを使用できます。実行時の外部辞書ファイルが不要になりますが、バイナリサイズが増加します。

IPADIC(日本語辞書)

% cargo build --release --features=embed-ipadic

IPADIC NEologd(日本語辞書)

% cargo build --release --features=embed-ipadic-neologd

UniDic(日本語辞書)

% cargo build --release --features=embed-unidic

ko-dic(韓国語辞書)

% cargo build --release --features=embed-ko-dic

CC-CEDICT(中国語辞書)

% cargo build --release --features=embed-cc-cedict

Jieba(中国語辞書)

% cargo build --release --features=embed-jieba

[!TIP] embed-* feature フラグ付きでビルドした後、embedded:// スキームで埋め込み辞書をロードできます:

% lindera tokenize --dictionary embedded://ipadic "関西国際空港限定トートバッグ"

詳細は Feature フラグ を参照してください。