Intro Page
   
 
       Skip Navigation LinksMain Page > My Japanese Study > CORPUS(コーパス)  
  
Hi~ Login Please!!
or Register~ ;-)
Login Join Member


Language change
Korean / Japanese / English
IP : 3.227.233.55  
 
Skip Navigation Links.
 
1. コーパス(Corpus)
 
2. 日本語コーパス(日本語コーパス)
 
3. コーパス論文
3-1. 日本語注釈コーパス(tagged corpus)の構築方法に関して - 金曘泳(Kim Yu Young)・眞島知秀
1) 論文の概要
- 韓国日本学会 (KAJA-Korea Association of Japanology) 2003年 7月 5日 発表
- 韓国日本学会 日本學報, Vol.57 No.1 93-107pp, 2003年 12月

2) 論文抄録
本稿は日本語タグ付きコ一パス(tagged corpus)の構築方法につして、高麗大学李漠燮敎授硏究室で作業が進められている、日韓竝列コ一パス構築の際の問題点を交えながら述べたものである。本稿ではまずテキストコ一パスと音声コ一パスの違い、また生フ一パスとタグ付きコ一パスとの違いについて説明し、各硏究分野におけるさまざまな形態のコ一パスについても見てきた。そしてタグ付きコ一パスがなぜ必要なのか、その必要性について述べた。タグ付きコ一パスの実際の構築方法についても詳しく触れ、各段階における注意点やどうすれば有用なコ一パスを構築することができるのかを考えてみた。

そして、タダ付け作業時における手作業と自動化の各方法を比較し、その長所と短所について正確で効率的という観点から検証してみた。その結果,最も実際的な方法としては、まず各種のタグ付け支援プログラムを利用して、全体的な加工を行なつた後、手作業でブログラムの誤認識を修正し、編集していくという方法であった。しかしフログラムを使うこの方法では、プログラム側の仕様によって、求めている作業結果が得られないものも多く、常に自分の硏究目的に合ったプログラムを探さなければならないという難点がある。しかし全ての作業を一つのブログラムに依存するのではなく、各 のブログラムの持つ特徴や長所なとを把握し、樣 なプログラムを組み合わせて自動化作業をすることができれば、より旱く、より正確に、より大量のタケ付きコ一パスを構築することができるということを確認した。

コ一パズの価値を決める均衡性、妥當性、一貫性を維持したタグ付きコ一パスを構築するためには、樣 なブログラムに関する知識と、それをうまく組み合わせて活用することのできる能力が、これからは必要不可欠になっていくであろう。

3) 論文の本文ダウンロード
- アドビアクロバット(Adobe Acrobat - PDF)
Download
 
  
  
All rights reserved by "yuiyu Research(by Yu Young, Kim)" Since 1996.