Intro Page
   
 
       탐색 건너뛰기 링크Main Page > Japanese NLP  
  
Hi~ Login Please!!
or Register~ ;-)
Login Join Member


Language change
Korean / Japanese / English
IP : 18.216.161.178  --
 
탐색 건너뛰기 링크입니다.
 
 
Quick link
 Japanese NLP(인공신경망 자연어처리)  / GPT2-JLPT TextData
   
 1. 일본어 텍스트 생성 및 일본어능력시험 레벨 검증을 위한 인공지능 시스템
  자연어 처리 플랫폼의 사전 모델에 대한 전이학습(Transfer learning) 및 파인튜닝(Fine Tuning)을 통해 기존의 사전 모델에 대한 성능개선 및 일본어학 및 일본어 교육에 특화된 인공지능 시스템의 개발에 관한 연구를 수행하여 본격적으로 일본어학 분야에 인공지능 관련 연구를 도입하고자 한다.

 구체적으로는 인공신경망 기술을 기반으로 개발된 자연어 처리 플랫폼 GPT-2를 기반으로 대규모 코퍼스를 사용하여 사전학습된 일본어 사전학습 모델 「GTP2-Japanese」를 지난 20년간의 일본어능력시험(이하, JLPT) 기출문제 데이터셋으로 파인튜닝을 수행 및 검증하여, JLPT에 특화된 인공지능 일본어 텍스트 생성 엔진을 개발했다.

 그리고 동시에 인공지능에 의해 자동으로 생성된 일본어 텍스트를 JLPT의 어휘, 문법, 한자 난이도 기준에 따라 자동 분석 가능한 JLPT 텍스트 레벨 검증 시스템 개발에 관한 연구를 수행하여 일본어학 및 일본어 교육 분야에 대한 맞춤형 인공지능 텍스트 생성 및 레벨 검증 시스템의 도입 가능성을 시험해 보았다.
 
 2.  GPT-2
 2015년 12월 11일 일론 머스크와 샘 알트만이 공동 설립한 인공지능 회사인 openAI사가 개발하여 2020년 5월에 공개한 자기회귀 언어 모델로, 정식 명칭은 Generative Pre-trained Transformer 2(GPT-2). 딥러닝을 이용해 마치 인간처럼 텍스트를 생성할 수 있는 인공지능 언어 모델.
   
 3. GPT2-Japanese
GPT-2 기반 일본어판 인공지능 언어 모델
https://github.com/tanreinama/gpt2-japanese
   
 4. GPT2-JLPT
 4.1 AOT_ai-JLPT 데이터셋
 
  a. 정확도 높은 머신러닝을 위한 텍스트 수정
    e.g.
A「日本人が昼ごはんによく食べるものは何だと思いますか。」
B 「そうですね。日本人ならおすしでしょう。」
→ 「日本人が昼ごはんによく食べるものは何だと思いますか。」
「そうですね。日本人ならおすしでしょう。」
    2009년 2회차 旧JLPT 3급, 문법 3-5 문제 중 일부
b. 태깅을 통한 전처리
    e.g.
「こんなにすわり心地のいいタクシーははじめてですよ。」
「そうですか。これは、自分で言うのもなんだけど、高級車なんですよ。」
→ 「こんなにすわり心地のいいタクシーははじめてですよ。」&→ 「こんなにすわり心地のいいタクシーははじめてですよ。」<|endoftext|>
「そうですか。これは、自分で言うのもなんだけど、高級車なんですよ。」<|endoftext|>
    1990년 旧JLPT 2급, 문법 2-2 문제 중 일부
 
  4.2 GPT2-JLPT 언어모델
 
  a. GPT2-JLPT_small
    다운로드 클릭
     
b. GPT2-JLPT_medium
    다운로드 클릭
     
b. GPT2-JLPT_large
    다운로드 클릭
     
   
   
5. 관련 논문 및 학술발표
5.1 논문
 
  1) 투고 예정
    「인공지능에 의한 일본어 텍스트 생성 및 일본어능력시험 난이도 분석 시스템 개발 연구」
     
5.2 학술발표
 
  1) 2021년 9월 11일한국일본어학회 제43・44회 통합 학술대회 발표 예정
    「인공지능에 의한 일본어 텍스트 생성 및 일본어능력시험 난이도 분석 시스템 개발 연구」
     
Quick link
 Japanese NLP(인공신경망 자연어처리)  / GPT2-JLPT TextData
   
 
  
  
All rights reserved by "yuiyu Research(by Yu Young, Kim)" Since 1996.