Web茶まめ:各種のUniDicを使って形態素解析ができます
解析対象:



解析前処理
半角文字を全角に変換 踊り字を展開 カタカナひらがな反転 数字処理

辞書選択
現代語 現代語話し言葉 旧仮名口語 近代文語 近世口語(洒落本) 中世口語(狂言) 中世文語(説話・随筆) 中古和文 上代(万葉集) IPAdic(現代語)

出力項目
語彙素 語彙素読み 品詞 ( 品詞-大分類 品詞-中分類 品詞-小分類 ) 活用型 活用形 発音形出現形 仮名形出現形 語種
書字形(基本形) 発音形(基本形) 仮名形(基本形) 語形(基本形) 語頭変化型 語頭変化形 語頭変化結合型
語末変化型 語末変化形 語末変化結合型 アクセント型 アクセント接続型 アクセント修飾型

出力形式
HTML形式で表示 CSV形式でダウンロード Excel形式でダウンロード


  

使い方説明

  • テキストボックスに入力した文章か、ファイル選択ボタンからアップロードしたテキストデータに対してMeCabによる形態素解析を行います。
  • テキストを入力後、解析前処理の有無/形態素解析に使用する辞書/出力項目/出力形式、を選択し実行するボタン、もしくはアップロードボタンを押すと形態素解析が実行されます。
  • アップロードするテキストデータは、メモ帳等で開けるtxt拡張子のものをご利用ください。テキストデータの文字コードは自動的にUTF-8へ変換されます。
  • 2辞書まで同時に解析、比較することができます。辞書選択で、解析を行いたい辞書を一つ、または二つ選んでください。
  • CSV形式でダウンロードする場合のテキストデータの容量は、1ファイルにつき10MBまでです。アップロードでは、一度に複数のファイルを選択してアップロードできます。容量が10MB以上のテキストデータは、10MBずつに分けてアップロードしてください。
  • Excel形式でダウンロードする場合、テキストデータの容量は1ファイル100KBまでです。
  • UniDic辞書のダウンロードページはこちら

    更新履歴      
  • 2016/06/14
  • 品詞の出力項目を、分類ごとに選べるように変更しました。Excel出力時の、バグを修正しました。
  • 2016/03/23
  • Web茶まめの解析機能をバージョンアップしました。
  • 2015/12/16
  • 洒落本辞書を近世口語辞書に統合しました。辞書の並びを変更しました。
  • 2015/10/05
  • 使い方説明を追記しました。
  • 2015/09/15
  • Web茶まめを公開しました。

    文字校正ツール「〓箱」へのリンク

    国立国語研究所 | コーパス開発センター| サイトポリシー| お問い合わせ