The effect of corpus size on case frame acquisition for predicate-argument structure analysis

Ryohei Sasano*, Daisuke Kawahara, Sadao Kurohashi

*この研究の対応する著者

研究成果: Article査読

2 被引用数 (Scopus)

抄録

This paper reports the effect of corpus size on case frame acquisition for predicate-argument structure analysis in Japanese. For this study, we collect a Japanese corpus consisting of up to 100 billion words, and construct case frames from corpora of six different sizes. Then, we apply these case frames to syntactic and case structure analysis, and zero anaphora resolution, in order to investigate the relationship between the corpus size for case frame acquisition and the performance of predicateargument structure analysis. We obtained better analyses by using case frames constructed from larger corpora; the performance was not saturated even with a corpus size of 100 billion words.

本文言語English
ページ(範囲)1361-1368
ページ数8
ジャーナルIEICE Transactions on Information and Systems
E93-D
6
DOI
出版ステータスPublished - 2010 6月
外部発表はい

ASJC Scopus subject areas

  • ソフトウェア
  • ハードウェアとアーキテクチャ
  • コンピュータ ビジョンおよびパターン認識
  • 電子工学および電気工学
  • 人工知能

フィンガープリント

「The effect of corpus size on case frame acquisition for predicate-argument structure analysis」の研究トピックを掘り下げます。これらがまとまってユニークなフィンガープリントを構成します。

引用スタイル