上智2016

コーパス日本語学入門(近現代語コーパス)

2016/05/12

形態論情報を利用した検索

UniDic見出し語の階層構造

見出し語の階層構造

unidic_hierarchy.png

各レベルが持つ情報*1

※語彙素読み・語形・発音形はカタカナ表記。語彙素は漢字を多用した「代表表記」。

基本形と出現形

語形以下のレベルでは、基本形(辞書見出し形=終止形)と出現形(実際の活用形)の別があり、活用語では違う形になる

例:アザラシが泳ぎます

見出し語の例とBCCWJ中の用例数

UniDicによる形態素解析

2016/05/06

日本語コーパスの形態論情報

品詞体系と見出し語の階層

2016/04/29(祝日授業実施日)

日本語コーパスの紹介(2) コーパスの設計とサンプリング

参考リンク

日本語コーパスの形態論情報

2016/04/22

コーパス検索アプリケーション「中納言」の申込みについて(来週以降)

現代日本語書き言葉均衡コーパス(BCCWJ)とは

日本語コーパスの紹介(1)コーパスとはどんなものか

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

2016/04/16

イントロダクション


*1 一部のみ。「中納言」で使えるのは更にこの一部分。
*2 この場合、活用形としては「連用形」

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS