Lindera ko-dic

辞書バージョン

このリポジトリには mecab-ko-dic が含まれています。

辞書フォーマット

mecab-ko-dic で使用される辞書フォーマットおよび品詞タグの情報は、mecab-ko-dic のリポジトリ README からリンクされているこの Google スプレッドシートに記載されています。

ko-dic は NAIST JDIC よりもフィールド列が 1 つ少なく、全体的に異なる情報セットを持っています(例: 単語の「原形」を提供しません)。

タグは世宗(Sejong)で規定されたものを若干修正したものです。世宗から mecab-ko-dic のタグ名へのマッピングは、上記スプレッドシートの 태그 v2.0 タブに記載されています。

辞書フォーマットの完全な仕様は(韓国語で)スプレッドシートの 사전 형식 v2.0 タブに記載されています。空の値はデフォルトで * になります。

IndexName (Korean)Name (English)Notes
0표면Surface
1왼쪽 문맥 IDLeft context ID
2오른쪽 문맥 IDRight context ID
3비용Cost
4품사 태그Part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
5의미 부류Meaning(確信するには例が少なすぎます)
6종성 유무Presence or absenceT は true、F は false、それ以外は *
7읽기Reading通常は表層形と一致しますが、外来語(例: 漢字語)では異なる場合があります
8타입TypeInflect(活用)、Compound(複合名詞)、Preanalysis(基分析)のいずれか
9첫번째 품사First part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、VV を返します
10마지막 품사Last part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、EP を返します
11표현Expression활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드 -- 活用、複合名詞、基分析がどのように構成されるかを示すフィールド

ユーザー辞書フォーマット (CSV)

簡易版

IndexName (Japanese)Name (English)Notes
0표면Surface
1품사 태그part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
2읽기reading通常は表層形と一致しますが、外来語(例: 漢字語)では異なる場合があります

詳細版

IndexName (Korean)Name (English)Notes
0표면Surface
1왼쪽 문맥 IDLeft context ID
2오른쪽 문맥 IDRight context ID
3비용Cost
4품사 태그part-of-speech tagスプレッドシートの 태그 v2.0 タブを参照
5의미 부류meaning(確信するには例が少なすぎます)
6종성 유무presence or absenceT は true、F は false、それ以外は *
7읽기reading通常は表層形と一致しますが、外来語(例: 漢字語)では異なる場合があります
8타입typeInflect(活用)、Compound(複合名詞)、Preanalysis(基分析)のいずれか
9첫번째 품사first part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、VV を返します
10마지막 품사last part-of-speech例: 品詞タグが "VV+EM+VX+EP" の場合、EP を返します
11표현expression활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드 -- 活用、複合名詞、基分析がどのように構成されるかを示すフィールド
12--12 以降は自由に拡張可能です。

API リファレンス

API リファレンスは以下の URL から参照できます: