본문 바로가기
러시아/에세이,레포트

“Это код.”와 “Это кот.”의 발음은 같은가? 러시아어 어말 유-무성음의 불완전 중화

by 누에고치 2024. 6. 16.
본 글은 2024 한국외대 언어연구소 상반기 학술대회"코퍼스언어학적 접근으로 바라본 러시아어 어말 유-무성음의 불완전 중화"라는 제목으로 발표한 기고문을 다듬은 것임을 밝힙니다.

 

우리가 러시아어를 배울 때 “Это код.”(이것은 코드이다)와 “Это кот.”(이것은 고양이다)은 모두 [ɛtə kot]로 발음하며, 차이가 없다고 교육되고 있습니다. 이를 어말무성음화라고 합니다. 영어와 한국어에 없기 때문에 익숙하지 않지만, 독일어나 러시아어 등 일부 언어에는 나타나는 현상입니다.

 

그러나 엄밀히 따져보면, 정말 두 문장의 발음이 완전히 동일할까요?

 

불완전 중화에 관한 기존 연구

아닙니다. 해당 언어의 화자들은 무의식적으로 ‘진정한 무성음’(t로 발음되지만 원래 d임)과 ‘무성음화된 유성음’(원래 t이고 t로 발음됨)을 음향음성학적으로 직전모음길이(VD) 및 파열길이(BD) 등으로 구분함이 여러 선행연구를 통해 알려져 있습니다. (Pye 1986, Dmitrieva, Jongman, and Sereno 2010; Shrager 2012; Kharlamov 2012)

 

이 분야에서 가장 많이 인용되는 실험 중 하나는 Pye(1986)의 것입니다. 그는 어말무성음화의 불완전중화를 직전의 모음길이(VD)를 통해 구분할 수 있다고 보았죠. 예를 들어 /kod/와 /kot/를 구분할 때 /o/의 길이를 보면 둘을 구분할 수 있다는 것입니다.

 

Pye의 실험 결과, 러시아어 화자들은 원래 유성음이었던 자음 앞에 위치한 모음을 더 길게 발음했습니다. 그러나, 해당 연구에서 /t-d/는 VD와 관계없는 예외로 남았습니다. 이후 Shrager(2012)는 파열길이(BD)를 통해 /t-d/ 쌍 또한 구분할 수 있음을 실험하였습니다. 파열길이란 파열음, 즉 [t]가 얼마나 길게 터지냐를 보는 것인데요. 쉬운 이해를 위해 한국어 발음기호로 전사하자면, 파열길이가 짧으면 [꼳]이었던 것이 길면 [꼿트]처럼 발음되게 되죠.

 

기존 연구의 한계

이러한 불완전 중화에 대한 연구는 주로 소수의 피실험자를 대상으로 통제된 최소대립쌍을 문장에 섞어 제공한 뒤, 음성 스펙트로그램 및 파형을 연구자가 수동·육안으로 분석하여 결과를 내는 방식으로 행해졌습니다.

 

저는 통제된 소량의 음성 데이터가 아니라, 무작위 단어가 모두 들어있는 다량의 음성 데이터를 이용하여도 동일한 결과가 도출되는지 코퍼스 분석을 통해 실험해볼 것입니다.

 

코퍼스 선정 및 러시아어 음성코퍼스 현황

현재 일반에 공개된 대규모의 러시아어 코퍼스는 많지 않습니다.

  1. «Один речевой день»(ORD): Степанова et al. (2008)에 의해 제안된 이 코퍼스는 광범위한 연구대상이 되었다. 그러나 이는 비공개 코퍼스이며, Sherstinova(2009, 258)가 서술하듯 목 주위에 마이크를 달고 일상을 보내며 녹음되었기에 잡음이 많아 본 연구의 대상으로는 부적합했다.
  2. “Golos”: Karpov, Denisenko, and Minkin(2021)이 제안한 1,240시간 분량의 코퍼스다. 기존 코퍼스의 적은 분량과 부정확한 기계주석을 해결하기 위하여 크라우드소싱을 통해 정확한 수동 주석 작업을 거쳤다. 분량 및 종류로 보아 본 논문에 적합하다고 생각되었으나, 안타깝게도 현재 정상적인 다운로드가 불가능하여 활용할 수 없었다.
  3. “RUSLAN”(최종 선정): Gabdrakhmanov, Garaev & Razinkov(2019)가 제안·공개한 음성 코퍼스입니다. 다음과 같은 특징이 있습니다.
    1. 본래 코퍼스 제작목적: TTS용 합성음성 제작
    2. 23세의 남성 러시아어 원어민이 표준 발음으로 녹음
    3. 약 22,200개의 음성 파일
    4. 대부분의 문장은 일상적인 문장부터 문학작품의 내용까지를 아우르는 임의의 내용으로 구성
    5. 파일당 평균 11.5개 단어
    6. 해당 코퍼스는 음성 파일과 텍스트 파일을 공개적으로 제공; 각 파일의 내용에 해당하는 러시아어 원문이 단일 CSV 파일 내의 각 행에 기록되어 있는 형태

 

데이터 처리 방법

RUSLAN은 문장 단위의 텍스트를 제공할 뿐 음소 및 음성 단위의 정보를 제공하지 않습니다. 마치 토익 리스닝 듣기파일처럼, 각 문장이 통째로 00001.mp3에 들어있고 텍스트의 1행에 "00001 / this is example sentence"이 써져 있는 형태입니다.

 

이를 제대로 처리하기 위해서는 음소의 구획(segmentation)을 나눠줘야 합니다. [th-i-s_i-z]

 

그러나, praat 등으로 수동으로 정렬하기에는 분량이 방대합니다. 그래서 기계적인 강제음성정렬(forced alignment)을 시도하였습니다. 본고에서는 접근이 용이하고 지속적인 업데이트가 제공되고 있다는 점에서 McAuliffe, et al.(2017)이 제안하는 Montreal Forced Aligner(MFA)를 사용하였습니다. 제공된 CSV의 각 행을 파이썬 스크립트를 활용하여 별도의 Textgrid로 변환한 뒤, MFA(v. 2.2.17)를 이용하여 자동정렬하였습니다. 실행데이터의 적합성은 praat(v. 6.4.01)로 검증하였습니다.


그림 1. 강제정렬 전 Textgrid

그림 2. 강제정렬 후 Textgrid

 

위와 같이 MFA가 음소를 나눠줍니다. 이렇게 22,200개의 Textgrid 파일이 만들어졌습니다.

 

이제, 파이썬 스크립트를 이용합니다. 모음 길이의 평균을 비교하는데, 각 대상은 다음과 같습니다.

  • 무성음화된 유성음: 정자법상 д, в, б, г, ж, з이며 음소표기 /d, v, b, g, ʐ, z/
  • 무성음: 정자법상 т, ф, п, к, ш, с이며 음소표기 /t, f, p, k, ʂ, s/

 

본 논문에서는 예외상황을 최소화하기 위하여 계산대상을 절대어말, 즉 ‘문장 마지막 위치의 어말무성음화’로 국한하였습니다. 어말무성음화는 접속사를 포함한 음운론적 단어(Pwd)의 끝에서 일어나지만, (Виноградов 1960; Padgett 2002) Pwd의 끝에서 언제나 장애음들이 무성음화되는 것은 아니기 때문입니다. Kulikov(2012)에 따르면 이는 발화속도, 숙어여부 등 요소의 영향을 받습니다.

 

모음의 길이는 MFA에 의해 강제생성된 phones 티어에서 모음기호가 가지는 길이를 기준으로 계산하였습니다. MFA는 IPA에 따라 음성기호를 출력하므로, 러시아어 IPA 표준을 기술한 Yanushevskaya and Bunčić (2015)를 참고하여 해당하는 모음 기호를 읽도록 했습니다.

 

연구

표 1. 각 음소 직전 모음의 평균 길이를 나타낸 표

음소 출현 평균 VD(초) 음소 출현 평균 VD(초) 배율(유성음/무성음)
t 908 0.062323789 d 146 0.084055205 1.34868575
f 9 0.086666667 v 497 0.053983903 0.622891193
p 13 0.081538462 b 15 0.078666667 0.964779874
k 434 0.060691244 g 88 0.069772727 1.149634155
ʂ 14 0.095 ʐ 22 0.091363636 0.961722488
s 184 0.080706522 z 55 0.099636364 1.234551576

 

[표 1]은 이렇게 처리된 데이터를 정리하여 도표화한 결과입니다. (MFA의 오류로 인하여 모음 길이가 0으로 계산되는 경우는 제외)

 

출현 횟수로 보면

  • 문장 마지막 위치에서 가장 많이 출현한 음소는 /t, v, k, s, d/ 순입니다.
  • 나머지 음소는 100회 미만이네요. 문장 수가 2만 개가 넘는데 말이죠.

 

단순 배율로 보면

  • /t-d, k-g, s-z/ 3개 쌍은 가정과 동일하게 유성음 직전 VD가 길었습니다.
  • /f-v, p-b, ʂ-ʐ/ 3개 쌍은 가정과 다르게, 무성음 직전에서 더 길었네요.

3개 쌍이나 가정과 다르다는 점에서 무언가 잘못되었다고 생각했습니다.

 

표 2. 각 쌍에 대한 독립표본 t-검정 실시 결과

유의확률(p-value) 효과 크기 95% 신뢰 구간
t-d 0.00000000001 -0.6117 (-0.6118, -0.6117)
f-v 0.00072124710 1.1443 (1.1443, 1.1444)
p-b 0.77278229697 0.1106 (0.1104, 0.1107)
k-g 0.02593977214 -0.2611 (-0.2612, -0.2610)
ʂ-ʐ 0.63137673891 0.1655 (0.1654, 0.1656)
s-z 0.00010284984 -0.6071 (-0.6072, -0.6070)

 

다음으로 [표 2]는 이 결과가 믿을 만한지 독립표본 t-검정을 돌려본 결과입니다.

 

통상 유의확률이 0.05 미만일 때 결과를 믿을 만하다고 얘기하는데, 실제로 6개 중 4개 쌍은 유의확률(p-value)이 0.05 미만이었습니다.

 

역시 무언가 잘못되었네요. /p-b, ʂ-ʐ/ 쌍의 경우 각각 0.772, 0.631로 0.05를 크게 상회하였습니다. 이로서, 해당 2개 쌍이 당초 가정과 다른 결과가 나왔던 것은 단순히 데이터가 적었거나 하는 이유로, 통계적인 오류가 발생한 결과일 가능성이 생겼습니다.

 

그런데 이상한 것은, /f-v/ 쌍입니다. 가정과 반대로 나왔는데요, 신뢰도가 매우 높고 단순 배율과 효과 크기가 모두 매우 큽니다. 그러나 이것도 설명할 수 있습니다. 표본의 크기가 너무 작은 것이죠. /f/의 경우 불과 9개로 매우 작은 반면 /v/의 경우 497개로 매우 커, 데이터가 비정상적입니다. 러시아어에서 /v/는 매우 활발하게 사용되지만 /f/는 보통 외래어 표기 시에만 사용하므로 이러한 차이가 도출되는 것으로 보입니다.

 

주목할 점: Pye(1986)와 Shrager(2012)는 /t-d/ 간의 VD 차이는 무의미하다고 보았으나, 본 연구에서는 평균 1.3배 길게 발화되었으며 통계적으로 유의미한 결과가 나왔습니다.

 

한계 및 보완 방법

본 논문은 다음의 한계를 가지고 있습니다.

  1. 모든 어말무성음화 상황을 가정하여 실험하지 않고 오직 문장 마지막 위치에서의 무성음화만을 실험
  2. 여러 화자에 의해 자연스럽게 발화된 코퍼스가 아니라 1) 단일 화자에 의해 2) 음성합성 목적으로 통제된 환경에서 발화된 3) 코퍼스를 사용하여 코퍼스언어학의 목적이자 당초 연구목적인 ‘대중에 의한, 일상 상황에서의 발화’를 온전히 담지 못함
  3. MFA에 의한 자동정렬이 실패하는 경우가 있어 유효한 표본이 더욱 적어짐
  4. 적은 표본으로 인하여 6개 중 3개 쌍에서 통계적으로 무의미한 결과가 도출

 

보완 방법

이러한 네 가지 한계를 보완하여

  1. 모든 어말무성음화 상황을 반영하고,
  2. 보다 다양하고 큰 코퍼스를 사용하고,
  3. 보다 정확한 강제음성정렬을 실시하여 재차 실험할 경우,
  4. 본 논문에서 통계적으로 무의미했던 3개 쌍의 결과가 명확해질 것이다.

 

결론: 재차 정리

  1. 기존 연구방법론의 한계와 이 연구의 방법론
    1. 기존 러시아어 유무성음 불완전중화 연구는 통제된 소량의 데이터로만 실험해옴
    2. 본 논문에서는 다량의 데이터로 실험하는 코퍼스언어학적 방법론을 제시
    3. 방법: 러시아어 음성코퍼스 RUSLAN을 Montreal Forced Aligner(MFA)를 통해 자동으로 강제정렬
    4. 목적: 정말로 Pye(1986)가 주장하듯 유성음과 무성음 앞에서의 모음길이(VD)가 유의미한 차이를 보이는지 분석해보았다.
  2. 분석결과:
    1. /k-g, s-z/ 쌍에 대해서는 당초 가정과 동일하게 유성음 앞에서 VD가 더 길게 발화되었다.
    2. 주목할만하게도, Pye(1986)에 의하면 VD 차이가 무의미해야 할 /t-d/ 쌍도 유성음 앞의 VD가 더 길게 발화되었다.
    3. 한편 /f-v, p-b, ʂ-ʐ/ 3개 쌍에서는 통계적으로 무의미한 결과가 나왔는데, 적은 표본 수가 원인으로 추정된다.

 

참고문헌

  1. Dmitrieva, Olga, Allard Jongman, and Joan A. Sereno. 2010. “Phonological Neutralization by Native and Non-Native Speakers: The Case of Russian Final Devoicing.” Journal of Phonetics 38 (3): 483–92. https://doi.org/10.1016/j.wocn.2010.06.001.
  2. Gabdrakhmanov, Lenar, Rustem Garaev, and Evgenii Razinkov. 2019. “RUSLAN: Russian Spoken Language Corpus for Speech Synthesis.” In Lecture Notes in Computer Science, 113–21. https://doi.org/10.1007/978-3-030-26061-3_12.
  3. Karpov, Nikolay, Alexander A. Denisenko, and Fedor Minkin. 2021. “Golos: Russian Dataset for Speech Research.” Interspeech, August. https://doi.org/10.21437/interspeech.2021-462.
  4. Kharlamov, Viktor. 2012. “Incomplete Neutralization and Task Effects in Experimentally-Elicited Speech.” Phd Dissertion, University of Ottawa.
  5. Kulikov, Vladimir. 2018. “Voicing and Voice Assimilation in Russian Stops.” Phd disseratation, The University of Iowa. https://doi.org/10.17077/etd.r6ib0d07.
  6. McAuliffe, Michael, Michaela Socolof, Sarah Mihuc, Michael Wagner, and Morgan Sonderegger. 2017. “Montreal Forced Aligner: Trainable Text-Speech Alignment Using Kaldi.” Interspeech 2017 (August). https://doi.org/10.21437/interspeech.2017-1386.
  7. Padgett, Jaye. 2002. “Russian Voicing Assimilation, Final Devoicing, and the Problem of [v].” Natural Language and Linguistic Theory.
  8. Pye, S. 1986. “Word-Final Devoicing of Obstruents in Russian.” Cambridge Papers in Phonetics and Experimental Linguistics 5: 1–10.
  9. Sherstinova, Tatiana Y. 2009. “The Structure of the ORD Speech Corpus of Russian Everyday Communication.” In Lecture Notes in Computer Science, 258–65. https://doi.org/10.1007/978-3-642-04208-9_37.
  10. Shrager, Miriam. 2012. “Neutralization of Word-Final Voicing in Russian.” Journal of Slavic Linguistics 20 (1): 71–99. https://doi.org/10.1353/jsl.2012.0000.
  11. Yanushevskaya, Irena, and Daniel Bunčić. 2015. “Russian.” Journal of the International Phonetic Association 45 (2): 221–28. https://doi.org/10.1017/s0025100314000395.
  12. Виноградов, В. В., Е. С. Истрина, and С. Г. Бархударов. 1960. Грамматика Русского Языка. М.: Издательство академия наук СССР.
  13. Степанова, С. Б., А. С. Асиновский, Н. В. Богданова, М. В. Русакова, and Т. Ю. Шерстинова. 2008. “Звуковой Корпус Русского Языка Повседневного Общения «Один Речевой День»: Концепция и Состояние Формирования.” Компьютерная Лингвистика И Интеллектуальные Технологии 7 (14).
반응형