Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한국어 학습자 구어 말뭉치의 전사자 간 일치도 연구 - 중국인 학습자의 음성 자료를 중심으로 -A Study on Inter-transcriber Reliability of Korean Learners' Spoken Corpus - Focusing on Chinese Learner's Spoken Data -

Other Titles
A Study on Inter-transcriber Reliability of Korean Learners' Spoken Corpus - Focusing on Chinese Learner's Spoken Data -
Authors
김미선오세원
Issue Date
May-2022
Publisher
연세대학교 언어정보연구원
Keywords
한국어 학습자 말뭉치; 구어 말뭉치; 구어 전사; 전사자 간 일치도; Korean Learners' Corpus; Spoken Corpus; Spoken Transcription; Inter-transcriber reliability
Citation
언어사실과 관점, v.56, pp 121 - 156
Pages
36
Journal Title
언어사실과 관점
Volume
56
Start Page
121
End Page
156
URI
https://yscholarhub.yonsei.ac.kr/handle/2021.sw.yonsei/6565
DOI
10.20988/lfp.2022.56.121
ISSN
1738-1908
2765-4354
Abstract
본 연구는 현재 한국어 학습자 구어 말뭉치 전사의 실제 양상을 확인하 고 개선 방안을 제시하기 위하여 한국어 학습자 구어 말뭉치를 구축하 는 과정에서 나타나는 전사자 간 일치도와 전사자들의 전사 양상을 살펴보는 것을 목적으로 한다. 이를 위하여 중국인 학습자가 생산한 음성 자료를 6명의 전사자가 전사하였으며, 음소 위치별로 전사자들의 오류 판단 여부에 대한 일치도를 플레이스 카파(Fleiss's Kappa) 계수와 코헨 카파(Cohen's Kappa) 계수를 통하여 확인하였다. 또한 불일치 어절의 개별 전사 양상 역시 질적으로 살펴보았다. 플레이스 카파 계수를 사용하여 통계적으로 분석한 결과, 초성(0.302), 중성(0.345)에 서의 전체적 일치도는 적당한(Fair) 수준으로, 종성(0.473)에서의 전체 적 일치도는 준수한(Moderate) 수준으로 나타났다. 이후 코헨 카파 계수를 사용하여 개별 전사자들 사이에 일대일로 나타나는 일치도를 분석하였다. 개별 일치도 역시 대체로 적당한(Fair) 수준과 준수한 (Moderate) 수준에 걸쳐 분포하는 것을 확인하였다. 그러나 전사자들의 개별 전사 양상을 분석한 결과, 학습자가 발화한 음소나 변이음을 판정하는 데 있어서는 전사자 간 불일치가 지속적으로 일어나는 것을 확인하였다. 본 연구는 한국어 학습자 구어 말뭉치 구축 과정에서 나타나는 전사자 간 일치도를 다룬 최초의 연구라는 점에서 의의가 있다. 또한 본 연구의 결과는 기구축된 한국어 학습자 구어 말뭉치 평가 및 개선에 사용될 수 있다.
The purpose of this study is to examine the inter-transcriber agreement and the transcriptional patterns of transcribers in the process of constructing the Korean Learners' Spoken Corpus. This will confirm the actual aspect of the transcription of the Korean Learners' Spoken Corpus and suggest direction for improvement. For this purpose, spoken data of a Chinese learner was transcribed by 6 transcribers, and the reliability on whether or not transcribers judged errors by phoneme position was confirmed through the Fleiss' Kappa and the Cohen's Kappa. The transcriptional aspect of inconsistent word segments was also examined. Statistical analysis using the Fleiss' Kappa coefficient showed that the overall agreement in the initial(0.302) and the medial(0.345) was at a fair level, and the overall agreement in the final(0.473) was found to be at a moderate level. The one-to-one correspondence between individual transcribers was analyzed using Cohen's Kappa. It was also confirmed that the individual agreement was also generally distributed over the Fair and Moderate level. However, as a result of analyzing the individual transcription patterns, it was confirmed that discrepancies between transcribers continued to occur in judging the phonemes or variant sounds spoken by the learner. This study is significant in that it is the first study to deal with the inter-transcriber reliability during the construction of the Korean Learners' Spoken Corpus. The results of this study can be used to evaluate and improve the Korean Learners' Spoken Corpus.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Liberal Arts > Korean Language and Literature > 1. Journal Articles

qrcode

Items in Scholar Hub are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Oh, Se Won photo

Oh, Se Won
문과대학 국어국문학과
Read more

Altmetrics

Total Views & Downloads

BROWSE