Lindera ko-dic

辞書バージョン

このリポジトリは mecab-ko-dic を含んでいます。

辞書フォーマット

mecab-ko-dicで使用されている辞書フォーマットと品詞タグに関する情報は、mecab-ko-dicの リポジトリreadme からリンクされている Googleスプレッドシート にドキュメント化されています。

ko-dicはNAIST JDICよりも機能列が1つ少なく、全く異なる情報セットを持っています(例:「原形」を提供していません)。

タグはSejongによって指定されたものを少し修正したものです。Sejongからmecab-ko-dicのタグ名へのマッピングは、上記スプレッドシートの 태그 v2.0 タブに記載されています。

辞書フォーマットは、スプレッドシートの 사전 형식 v2.0 タブに(韓国語で)完全に指定されています。空の値は * がデフォルトとなります。

インデックス名前 (韓国語)名前 (英語)備考
0표면Surface
1왼쪽 문맥 IDLeft context ID
2오른쪽 문맥 IDRight context ID
3비용Cost
4품사 태그Part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
5의미 부류Meaning
6종성 유무Presence or absenceT (真)、F (偽)、その他は *
7읽기Reading通常は表層形と一致しますが、漢字語などの外来語では異なる場合があります
8타입Type次のいずれか: Inflect (활용)、Compound (복합명사)、または Preanalysis (기분석)
9첫번째 품사First part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、VV を返します
10마지막 품사Last part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、EP を返します
11표현Expression활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드 – 活用、複合名詞、既分析がどのように構成されているかを示すフィールド

ユーザー辞書フォーマット (CSV)

シンプル版 (Simple version)

インデックス名前 (韓国語)名前 (英語)備考
0표면Surface
1품사 태그part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
2읽기reading通常は表層形と一致しますが、漢字語などの外来語では異なる場合があります

詳細版 (Detailed version)

インデックス名前 (韓国語)名前 (英語)備考
0표면Surface
1왼쪽 문맥 IDLeft context ID
2오른쪽 문맥 IDRight context ID
3비용Cost
4품사 태그part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
5의미 부류meaning
6종성 유무presence or absenceT (真)、F (偽)、その他は *
7읽기reading通常は表層形と一致しますが、漢字語などの外来語では異なる場合があります
8타입type次のいずれか: Inflect (활용)、Compound (복합명사)、または Preanalysis (기분석)
9첫번째 품사first part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、VV を返します
10마지막 품사last part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、EP を返します
11표현expression활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드 – 活用、複合名詞、既分析がどのように構成されているかを示すフィールド
12--12以降は自由に拡張可能です。

APIリファレンス

APIリファレンスは以下で公開されています: