インストール

前提条件

  • Python 3.10 以降(3.14 まで)
  • Rust ツールチェーン -- rustup 経由でインストール
  • maturin -- Rust ベースの Python 拡張をビルドするための Python パッケージ

maturin を pip でインストールします:

pip install maturin

開発ビルド

lindera-python を開発モードでビルドしてインストールします:

cd lindera-python
maturin develop

または、プロジェクトの Makefile を使用します:

make python-develop

学習機能付きビルド

train feature を有効にすると、CRF ベースの辞書学習機能が利用可能になります。デフォルトで有効になっています:

maturin develop --features train

辞書埋め込みビルド

辞書をバイナリに直接埋め込むことで、実行時に外部辞書ファイルが不要になります:

maturin develop --features embed-ipadic

Feature フラグ

Feature説明デフォルト
trainCRF 学習機能有効
embed-ipadic日本語辞書(IPADIC)の埋め込み無効
embed-unidic日本語辞書(UniDic)の埋め込み無効
embed-ipadic-neologd日本語辞書(IPADIC NEologd)の埋め込み無効
embed-ko-dic韓国語辞書(ko-dic)の埋め込み無効
embed-cc-cedict中国語辞書(CC-CEDICT)の埋め込み無効
embed-jieba中国語辞書(Jieba)の埋め込み無効
embed-cjk全 CJK 辞書の埋め込み(IPADIC、ko-dic、Jieba)無効

複数の feature を組み合わせることができます:

maturin develop --features "train,embed-ipadic,embed-ko-dic"

インストールの確認

インストール後、Python で lindera が利用可能であることを確認します:

import lindera

print(lindera.version())