Lindera ko-dic

辞書バージョン

このリポジトリには mecab-ko-dic が含まれています。

mecab-ko-dic で使用される辞書フォーマットおよび品詞タグの情報は、mecab-ko-dic のリポジトリ README からリンクされているこの Google スプレッドシートに記載されています。

ko-dic は NAIST JDIC よりもフィールド列が 1 つ少なく、全体的に異なる情報セットを持っています（例: 単語の「原形」を提供しません）。

タグは世宗（Sejong）で規定されたものを若干修正したものです。世宗から mecab-ko-dic のタグ名へのマッピングは、上記スプレッドシートの 태그 v2.0 タブに記載されています。

辞書フォーマットの完全な仕様は（韓国語で）スプレッドシートの 사전 형식 v2.0 タブに記載されています。空の値はデフォルトで * になります。

Index	Name (Korean)	Name (English)	Notes
0	표면	Surface
1	왼쪽 문맥 ID	Left context ID
2	오른쪽 문맥 ID	Right context ID
3	비용	Cost
4	품사 태그	Part-of-speech tag	スプレッドシートの `태그 v2.0` タブを参照
5	의미 부류	Meaning	（確信するには例が少なすぎます）
6	종성 유무	Presence or absence	`T` は true、`F` は false、それ以外は `*`
7	읽기	Reading	通常は表層形と一致しますが、外来語（例: 漢字語）では異なる場合があります
8	타입	Type	`Inflect`（活用）、`Compound`（複合名詞）、`Preanalysis`（基分析）のいずれか
9	첫번째 품사	First part-of-speech	例: 品詞タグが "VV+EM+VX+EP" の場合、`VV` を返します
10	마지막 품사	Last part-of-speech	例: 品詞タグが "VV+EM+VX+EP" の場合、`EP` を返します
11	표현	Expression	`활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드` -- 活用、複合名詞、基分析がどのように構成されるかを示すフィールド

Index	Name (Japanese)	Name (English)	Notes
0	표면	Surface
1	품사 태그	part-of-speech tag	スプレッドシートの `태그 v2.0` タブを参照
2	읽기	reading	通常は表層形と一致しますが、外来語（例: 漢字語）では異なる場合があります

Index	Name (Korean)	Name (English)	Notes
0	표면	Surface
1	왼쪽 문맥 ID	Left context ID
2	오른쪽 문맥 ID	Right context ID
3	비용	Cost
4	품사 태그	part-of-speech tag	スプレッドシートの `태그 v2.0` タブを参照
5	의미 부류	meaning	（確信するには例が少なすぎます）
6	종성 유무	presence or absence	`T` は true、`F` は false、それ以外は `*`
7	읽기	reading	通常は表層形と一致しますが、外来語（例: 漢字語）では異なる場合があります
8	타입	type	`Inflect`（活用）、`Compound`（複合名詞）、`Preanalysis`（基分析）のいずれか
9	첫번째 품사	first part-of-speech	例: 品詞タグが "VV+EM+VX+EP" の場合、`VV` を返します
10	마지막 품사	last part-of-speech	例: 品詞タグが "VV+EM+VX+EP" の場合、`EP` を返します
11	표현	expression	`활용, 복합명사, 기분석이 어떻게 구성되는지 알려주는 필드` -- 活用、複合名詞、基分析がどのように構成されるかを示すフィールド
12	-	-	12 以降は自由に拡張可能です。

API リファレンスは以下の URL から参照できます: