更新履歴
Web茶まめについて
国立国語研究所
サイトポリシー
使い方
テキストボックスに入力した文章か、ファイル選択ボタンからアップロードしたテキストデータに対してMeCabによる形態素解析を行います。
テキストを入力後、解析前処理の有無/形態素解析に使用する辞書/出力項目/出力形式を選択し一番下にある「解析する」ボタンを押すと形態素解析が実行されます。
テキストを入力
クリア
テキストファイルから解析
ファイルを選択
複数のファイルを選択してアップロードできます。
CSV形式でダウンロードする場合のテキストデータの容量は、1ファイルにつき5MBまでです。
辞書、出力項目を増やすと出力ファイルのデータサイズが大幅に増加しますので、ご注意ください。
容量が5MB以上のテキストデータは、5MBずつに分けてアップロードしてください。合計ファイルサイズが大きすぎると、失敗する場合があります。
Excel形式でダウンロードする場合、テキストデータの容量は1ファイル100KBまでです。
解析前処理
HTMLタグ・《》タグを削除
半角→全角変換
踊り字を展開
カタカナひらがな反転
数字処理
改行処理
辞書選択
2辞書まで同時に解析・比較することができます。解析を行いたい辞書を最大で2つ選んでください。
現代語
現代語話し言葉
近現代口語小説
旧仮名口語
近代文語
近世江戸口語
近世上方口語
近世文語
中世口語
中世文語
中古和文
上代語
和歌
関西方言
IPAdic(現代語)
辞書が3つ以上選択されています
出力項目
語彙素
語彙素(代表表記)
語彙素(細分類)
語彙素読み
品詞
品詞-大分類
品詞-中分類
品詞-小分類
品詞-細分類
活用型
活用形
発音形出現形
仮名形出現形
語種
書字形(基本形)
発音形(基本形)
仮名形(基本形)
語形(基本形)
語頭変化型
語頭変化形
語頭変化結合型
語末変化型
語末変化形
語末変化結合型
アクセント型
アクセント接続型
アクセント修飾型
LexID(語彙表ID)
語彙素ID(lemmaID)
出力形式
HTML形式で表示
CSV形式でダウンロード
Excel形式でダウンロード
Chakiインポート形式でダウンロード
大納言形式でダウンロード
CSV形式の文字コードを選択
UTF-8(BOM付き)
UTF-8
SJIS
テキストがありません
Chaki形式では辞書は1つのみ選択できます