국회회의록 형태 주석 말뭉치의 구축 과정과 형태 사용 빈도 분석
National Assembly Minutes Corpus Compilation and Morpheme Usage Frequency Analysis

초록

이 연구는 국회회의록 형태 주석 말뭉치의 구축 과정을 소개하고 구축된 말뭉치의 형태소 사용 빈도를 밝히는 것을 목적으로 한다. 이 연구에서 구축한 국회회의록 형태 주석 말뭉치는 1940년대부터 2010년대까지 총 189회차 회의록으로 이루어진 말뭉치 언어 자료로서 총 1,037,435 어절로 구성되었다. 품사 범주별로 고빈도 형태소 상위 40위를 살피고 서상규(2015) 『한국어 구어 빈도 사전1(잦기순)』과의 비교를 통해 국회회의록 말뭉치 또한 구어 자료로서 일반적인 구어 자료와 유사한 성격을 지니기는 하지만 ‘국회 회의’라는 특수 맥락과 공적 대화의 특성이 더 부각된 자료라는 점에서 몇몇 차이가 있음을 확인하였다.

제목
국회회의록 형태 주석 말뭉치의 구축 과정과 형태 사용 빈도 분석
제목 (타언어)
National Assembly Minutes Corpus Compilation and Morpheme Usage Frequency Analysis
저자
정해윤김지영김교연
DOI
10.20988/lfp.2023.58..39
발행일
2023-02
저널명
언어사실과 관점
58
페이지
39 ~ 75