본문 바로가기
러시아/에세이,레포트

러시아어 등급성 형용사의 반의관계 분석

by 누에고치 2024. 2. 21.

서론

한 언어의 어휘를 이루는 데에 있어 반의어 관계는 매우 중요한 위치에 있다. 예컨대, Lee(2013)는 기존 연구에서 반의어로 제시되었던 6개 영어 등급성 형용사 쌍[각주:1]을 분석한 결과 일부 쌍의 경우 공유하는 연어(collocation)가 없거나, 각자의 반의어가 서로의 상위 연어에 산입되지 않았다는 점에서 반의적 관계에 의문을 제기한 바 있다.[각주:2] 본 논문에서는 Lee(2013)의 연구에서 그 대상을 러시아어의 등급성 형용사 반의어 쌍으로 변경하여, 각 형용사 쌍의 출현횟수 및 연어 관계를 분석함으로써 러시아어의 경우에도 주요 등급성 반의어 형용사들에 대해 동일한 결과가 산출되는지, 아니라면 어떤 관계를 보이는지 분석하고자 한다. 분석을 위하여 이용한 코퍼스는 현존하는 러시아어 코퍼스 가운데 가장 방대한 국립러시아어코퍼스(RNC)이며, 이 가운데 ‘주(main) 코퍼스’(약 3억 7,400만개)를 대상으로 한다.[각주:3]

연구 방법론

상위 연어의 산출 방식: Log Dice

연어 분석 시에는 단순히 동시 출현빈도로 정렬하는 것이 아니라, 보다 효율적인 방법으로 LogDice[각주:4]가 제안, 사용되고 있다. (Rychlý 2008, Matytcina and Grigoryanova 2022) 해당 방법의 유용한 특징으로는 “코퍼스의 최종 크기에 구애받지 않으며, 최댓값이 14로 한정되며, 음수값은 단어 A-B간 연어관계에 통계적 특징이 없음을 나타낸다” (Monakhov 2023) RNC가 제공하는 웹 UI 또한 LogDice를 기본 정렬 방법으로 제시하고 있다. 모델이 되었던 Lee(2013)가 실험 시 동시출현빈도를 기준으로 상위 연어를 산정한 것과는 다르게, 본 연구에서는 이와 같은 방법을 따라 ‘상위 n개 값’을 산정할 때 단어 A와 B의 동시 출현횟수가 아닌 A와 B간 LogDice값을 기준으로 할 것이다.

 

그림 1. RNC의 연어 검색 결과 일부를 나타낸 화면. (короткий)

 

대상 형용사의 선정

본 논문에서는 Lee(2013)가 원천으로 삼고 있는 자료 (Paradis and Willners 2006, Quirk, et al. 1985)를 참고하여, ‘더 적절한 반의어’로 밝힌 3개 쌍(각주 3번 참조)을 포함한 영어 등급성 반의어 형용사 6개 쌍을 분석의 대상으로 한다. 해당 단어에 적합한 러시아어 대응어를 찾는 과정에서는 Tribushinina(2011)가 반의어 연구 시 사용한 단어를 주 자료로 사용하였고, 보조적으로 케임브리지 인터넷 영노사전[각주:5]을 활용하였다. 추가로, 주된 반의어로 함께 고려할 수 있는 단어 1개(тесный)를 분석하였다. 각 쌍 중에서 X는 상대적으로 유표성이 적은 개체를, Y는 유표성이 큰 개체를 뜻한다. 결과적으로 선정된 6개 쌍(12+1개 단어)은 다음과 같다.

 

 

 

X: 상대적 무표 Y: 상대적 유표
영어 러시아어 한국어 영어 러시아어 한국어
short короткий 짧다 long длинный 길다
narrow узкий(тесный) 좁다 wide широкий 넓다
low низкий 낮다 high высокий 높다
thin тонкий 얇다 thick толстый 두껍다
new новый 새롭다 old старый 낡다
small маленький 작다 large большой 크다

표 1. 대상이 되는 형용사 6쌍(X, Y)

연구

출현횟수에 따른 유/무표성 검증

먼저, 통상적으로 무표 요소(X)는 언급할 필요성이 유표 요소(Y)에 비해 적으므로 출현 빈도는 유표 요소가 더 클 것이라는 가정 아래 각 단어의 총 출현횟수를 측정해 보았다.

 

X 출현 평균 Y 출현 배수 평균
короткий 44367 123170.5 длинный 72160 1.626434 146156.8
узкий 31469 широкий 71294 2.265531
низкий 41158 высокий 147839 3.591987
тонкий 44966 толстый 34736 0.772495
новый 431285 старый 174727 0.405131
маленький 145778 большой 376185 2.580533

표 2. 각 형용사의 출현횟수 및 쌍별 배수, 유표/무표 전체의 평균

6개 쌍의 출현횟수의 평균을 계산했을 때 무표 요소(123170.5회)에 비해 유표 요소(146156.8회)의 출현횟수는 약 118.6%의 비율을 보여, 유의미하게 출현빈도가 잦다는 결과를 나타냈다. 한편, новый/старый, тонкий/толстый의 경우 다른 4개 쌍과는 다르게 무표 요소의 출현횟수가 유표 요소에 비해 각각 약 246.8%, 약 129.5% 더 많은 결과를 보여 역전된 관계를 보여주었다.

Lee(2013)의 연구결과에서 thin/thick이 그랬듯 тонкий/толстый의 결과도 반전되었다. 이는 Lee의 추정과 유사하게 대안적인 반의어의 존재, 예컨대 ‘뚱뚱하다’(полный-154997회, пухлый-3806회) 등이 반영되지 않아 나타나는 문제로 보인다.

한편, новый-старый의 경우 новый에 대한 대안적인 반의어로 знакомый(낯익은, 81837회), прежний(이전의, 59848회) 등이 있긴 하나, тонкий에 비해 상대적으로 빈약하다. новый가 431,285회로 старый에 비해 약 2.5배 많이 출현했기 때문에, 이들의 출현빈도를 모두 합하더라도 новый에 달하기에는 상당히 부족하기 때문이다. '새롭다'는 것은 전통적으로 무표 요소로 간주하며, 많은 경우에 실제로 그렇다. 다음 예문에서도 그런데, 컴퓨터에 일반적으로 기대되는 속성은 성능이 좋거나, 동작이 빠르거나, 오래되지 않은, 즉 새롭다는 것이므로 '새로운 컴퓨터'라는 표현은 의외성이 가미되지 않은 무표적 표현으로 볼 수 있다.

...будто это был самый лучший и самый новый компьютер на свете. (…마치 이것이 세상에서 가장 좋은, 가장 컴퓨터인 것처럼.) [НКРЯ: Елена Павлова. Вместе мы эту пропасть одолеем! // «Даша», 2004]

그렇다면 무표 요소인 '새롭다'가 '오래되다'에 비해 2.5배 많이 출현한 것을 어떻게 설명할 것인가? 이 문제에 대한 또 다른 해석이 있다. '새롭다'가 '오래되다'와 하나의 척도에서 존재하는 쌍이 아니라는 것이다. Akşehirli(2014)는 다른 형용사에 비해 오래되다-새롭다, 어리다-나이들다 등 일부 형용사 쌍의 경우 무표성을 나타내는 쌍이 따로 없다고 보았다.[각주:6] (Akşehirli 2014, 52) 해당 쌍들은 통상적으로 생각되는 등급성 반의어의 단일 척도 모델과는 다르게 하나의 척도 안에 있는 것이 아니라 '새롭다'의 척도와 '오래되다'의 척도가 이중으로 존재한다는 것이다. 이 모델에 따르면 '새롭다'의 척도가 0이라면 '오래되다'의 척도는 최대치에 달한다. 즉, 무엇이 다른 하나에 대한 유표 요소이거나, 무표 요소라고 볼 수 없게 된다.

 

그림 2. Akşehirli가 제시하고 있는 이중 척도 모델. (Akşehirli 2014, 61)

공기 연어 분석

다음으로, 각 단어와 함께 출현하는 연어를 분석함으로써 각 단어의 문장 내 쓰임을 알아보고, 또한 두 반의어가 공통으로 가지는 연어에 대해 알아봄으로써 두 단어 간의 반의어 관계가 잘 성립하는지 논의해보도록 한다. 모든 분석은 상위 10개 연어를 대상으로 하였다. 상위 10개 값을 정렬, 선정하는 것은 상술한 LogDice값을 기준으로 하였다.

 

X X 연어 공통연어 Y 연어 Y
короткий срок волна юбка промежуток замыкание рукав стрижка время фраза длинный волос узкий коридор борода тонкий ресница нос ряд длинный
узкий
(тесный)
полоска проход длинный щель тропинка улочка коридор ущелье
(контакт связь сотрудничество дружба взаимодействие кружок общение душный кольцо)
круг полоса
(круг)
распространение масса применение более спектр долина смысл широкий
низкий поклон частота потолок средний высокий значительно уровень температура чем цена рост гора более степень качество стройный высокий
тонкий длинный струйка шея талия нежный пленка бровь слой губа палец журнал тетрадь стекло кишка бревно очки толстый
новый год жизнь для мир появиться о время место новый старый знакомый друг дом молодой со добрый дева старый
маленький девочка городок домик ребенок рост маленький большой комната совсем мальчик   количество очень самый с театр чем иметь значение малый большой

표 3. 형용사 X, Y의 연어 및 공통연어 (상위 10개 쌍 기준)

 

설정한 6개 쌍 가운데 총 5개 쌍이 상위 10개 연어에서 공통연어를 공유하였다. короткий/длинный, узкий/широкий, низкий/высокий, тонкий/толстый, новый/старый의 쌍이었다. 한편 маленький/большой 쌍은 상위 17개 연어부터 공통연어가 존재했다. 이러한 관계로 볼 때 앞의 다섯 쌍에 비해 маленький/большой는 상대적으로 약한 반의어 관계를 지닐 것으로 보인다.

короткий/длинный 쌍은 공통 연어로 длинный를 가지고 있었다. короткий의 경우 срок(기간), время(시간), промежуток(간격) 등 시간적인 표현부터 юбка(치마), рукав(소매), стрижка(이발) 등 의류 및 패션과 관련된 용어 волна(파형)과 합쳐셔 '단파'를, замыкание(누전)과 합쳐져 '합선' 등 어구로서 사용되기도 하였다. длинный의 경우 волос(머리카락), борода(수염), ресница(속눈썹), нос(코) 등 신체어휘가 많이 나타났으며, тонкий(얇은), узкий(좁은) 등의 형용사가 연어로 나타났다는 점에서 같은 두께일 때 길어지면 얇아진다는 물리적인 특성을 보이고 있다.

узкий/широкий 쌍은 공통 연어로 круг(원), полоса(띠)를 가지고 있었던 한편, тесный/широкий 쌍의 공통연어는 круг(원) 하나였다. узкий의 경우 проход(통로), щель(틈), тропинка(작은 길), улочка(골목길), коридор(복도), ущелье(협곡) 등 좁고 긴 빈 공간을 나타내는 단어에 많이 결합하였다. 반면, тесный의 경우 контакт(연락), связь(연결), сотрудничество(협력), дружба(우정), взаимодействие(상호 작용), кружок(동아리), общение(소통) 등 추상적인 용어가 상위 10개 단어 중 상당수를 차지하였다. 한편, широкий의 경우 распространение(분포), применение(적용), смысл(의미), спектр(스펙트럼) 등 추상적인 의미를 가진(또는 그렇게 사용될 수도 있는) 단어)와 결합하였고, масса(질량)나 долина(계곡) 등 물리적인 의미만을 갖는 의미와도 결합하였다.

низкий/высокий 쌍은 가장 많은 공통 연어(4개)를 공유하는 쌍으로 уровень(수준), температура(온도), чем(-보다), цена(가격)를 가지고 있었다. низкий는 частота(빈도), средний(평균), значительно(상당히) 등과 공기하여 통계적인 맥락에서 자주 사용되는 것으로 보인다. 상위 10개 연어 내에 반의어 высокий 또한 나타났다. поклон과 결합하여 низкий поклон으로 쓰이는 것으로 보이는데, 이는 높은 수준의 경배를 나타낸다. высокий의 경우 рост(키), стройный(날씬한), гора(산) 등 물리적인 요소와 степень(정도), качество(품질) 등 추상적인 요소와 모두 결합하였다.

тонкий/толстый 쌍은 공통 연어로 слой(층), губа(입술), палец(손가락)를 가지고 있었다. тонкий의 경우 шея(목), талия(허리), бровь(눈썹) 등 신체부위에 많이 사용되었으며, 특히 нежный(부드러운)과 공기하여 '섬세하다'라는 의미로 신체부위를 표현하기도 한다.

 

У тебя тонкие, нежные пальцы, как у артиста, у тебя тонкая, нежная душа... (자네에겐 섬세한 손가락이 있잖나. 마치 배우처럼. 마음도 섬세하고 말이야.) [НКРЯ: А. П. Чехов. Вишневый сад (1904)]

반면, толстый는 일상생활 속 사물을 나타내는 단어가 많이 나타났다. 공기하는 단어들을 살펴보면 журнал(잡지), тетрадь(공책), стекло(유리), очки(안경) 등 납작한 물체가 두꺼워지는 것과 кишка(창자), бревно(나무통) 등 원통형의 물체의 지름이 늘어나는 것 모두를 의미할 수 있음을 확인할 수 있다.

новый/старый 쌍은 공통 연어로 서로의 단어 그 자체, 즉 новый, старый를 가지고 있었다. новый가 год(년), жизнь(삶), время(시간) 등 시간적인 의미에서 많이 사용된 반면 старый는 знакомый(지인), друг(친구), дева(처녀) 등 사람을 나타내는 어휘에 많이 사용되었다.

маленький/большой 쌍은 상위 10개 연어 내에서는 공통 연어가 없었다. маленький는 городок(도시), домик(집), комната(방) 등 공간을 나타내는 단어와 девочка(소녀), мальчик(소년), ребенок(어린이) 등 나이가 적은 인간을 나타내는 단어에 결합하였다. 지소사가 존재하는 러시아어의 특성상 -ок, -ик 등이 붙은 지소사와 함께 공기하는 경우가 많았다. 반의어인 большой도 상위 10개 연어에 포함되었다. 한편, большой의 경우 очень(매우), самый(가장)로 강조되는 경우가 많았다. иметь значение(의미를 가지다)와 결합해 ‘중요하다’라는 사실상의 숙어로 쓰이며, театр(극장)와 결합해 ‘볼쇼이 극장’이라는 고유명사를 만들어내기도 했다. маленький는 19위에 그쳤고, 상위 10개 연어에는 동일 의미이지만 다른 단어인 малый(작은)가 포함되었다. 러시아어에는 지대사 역시 존재하지만 활발하게 사용되지 않기 때문에 большой가 지대사와 함께 사용되는 경우는 드물었다.

한 쌍을 제외한 모든 반의어 쌍은 상위 10개 연어 내에서 공통 연어를 가지고 있었다. 유일한 예외였던 маленький/большой 쌍은 상위 10개 연어 내에서는 공통 연어가 없었으나 상술한 것과 같이 상위 17위 연어부터 공통 연어가 출현하며, 두 단어 모두 상위 100개 내에서 각자의 반의어를 포함하고 있는 등 반의어 관계가 아주 약하다고 보기에는 힘들었다.

한편, Lee(2013)는 자신이 대상으로 한 6개 쌍 가운데 오직 3개 쌍만이 상위 100개 연어 내에 각자의 반의어를 포함하고 있다고 서술한 바 있는데, 분석에 사용된 모든 형용사 쌍은 상위 100개 연어 내에 각자의 반의어를 포함하고 있었다.

결론

지금까지 Lee(2013)이 최종적으로 ‘진정한 등급성 형용사 반의어’로 제시한 영어 형용사를 러시아어의 대응되는 등급성 형용사로 대체하여 러시아국립코퍼스의 말뭉치에서 분석해보았다. 먼저, 유표 요소의 출현횟수가 무표 요소보다 많을 것이라는 전제 하에 단어 자체의 출현횟수를 중심으로 분석하였다. 무표 요소와 유표 요소 전체의 평균을 분석해본 결과, 가정과 동일하게 유표 요소의 출현이 많았다. 대부분의 개별 쌍 또한 유표 요소가 크게 나왔거나, 그렇지 않을 경우에도 단순한 반의어 설정에 의한 오차로 나타났다. 그러나, новый ‘새로운’ – старый ‘오래된’쌍의 경우 불일치하는 결과가 매우 강하게 나왔다. 해당 쌍 자체의 유/무표 대립이 이뤄지지 않는다는 가설을 세워볼 수 있으며, 이는 이중 척도 모형으로 설명된다.

다음으로, 공기하는 연어를 중심으로 분석한 결과 모든 쌍이 상위 100개 연어 내에 그 반의어를 포함하고 있었고, 5개 쌍은 상위 10개 연어 내에 공통 단어를 가지고 있었다. 상위 10개 내에 공통 연어가 없었던 маленький ‘작은’ – большой ‘큰’ 쌍의 경우 상위 17개 연어에 공통어가 존재해, 반의어 관계를 의심할 정도의 결과를 나타내지는 않았다.

결론적으로 본 논문의 대상으로 삼은 6개 쌍은 유/무표 대립성이 의심되는 하나의 쌍을 제외하고 모두 등급성 반의어 쌍으로서의 적절성과 유-무표 대립으로서의 적절성은 가정과 동일하다고 볼 수 있었다. 이는 러시아어의 해당 형용사들이 (tall/high가 모두 высокий로 번역되는 등 1:1 대응이 되지 않는 관계임에도 불구하고) 영어/스웨덴어의 대응하는 형용사 반의어 쌍과 같은 대립관계 하에서 분석될 수 있음을 시사한다.

참고 문헌

  1. Akşehirli, Soner. "Dereceli karşıt anlamlılarda belirtisizlik ve ölçek yapısı." Journal of Language and Linguistic Studies 10, no. 1 (4 2014): 47-66.
  2. Lee, Hye-Kyung. "Antonymy and gradability: A corpus-based approach on English gradable antonyms." Linguistic Research 30, no. 2 (2013): 335-354.
  3. Matytcina, Marina Stanislovovna, and Tatiana. Grigoryanova. "Statistical Methods for Extracting Collocations from a Text Corpus." 2022 2nd International Conference on Technology Enhanced Learning in Higher Education (TELE). Lipetsk, 2022. 55-57.
  4. Monakhov, Sergei. "How Complex Verbs Acquire Their Idiosyncratic Meanings." Language and Speech, 9 2023.
  5. Paradis, Carita, and Caroline Willners. "Antonymy and negation: the boundedness hypothesis." Journal of Pragmatics 38, no. 7 (2006): 1051-1080.
  6. Quirk, Randolph, Sidney Greenbaum, Geoffrey Leech, and Jan Svartvik. A Comprehensive Grammar of the English Language. Harlow, Essex: Longman, 1985.
  7. Rychlý, Pavel. "A Lexicographer-Friendly Association Score." RASLAN, 2008: 6-9.
  8. Tribushinina, Elena. "Boundedness and relativity - A contrastive study of English and Russian." Languages in Contrast 11, no. 1 (2011): 106-128.

 


 

글이 도움이 되었다면, 왼쪽 아래 공감❤️ 꾹! 눌러주세요!

 


 

  1. short-tall, narrow-wide, low-high, thin-thick, young-old, small-big [본문으로]
  2. big-small, tall-short, young-old. Lee는 더 적절한 반의어 쌍으로 small-large, short-long, old-new를 제시하고 있다. [본문으로]
  3. 국립러시아어코퍼스(Национальный корпус русского языка, НКРЯ, 또는 Russian National Corpus, RNC)는 러시아과학아카데미(РАН)에서 제공하는 러시아어 코퍼스로, 2023년 12월 기준 '메인' 코퍼스가 약 3억 7400만개에 달한다. 해당 메인 코퍼스는 «최근 3세기간의 수기, 인쇄, 전자 산문 텍스트로서 다양한 장르를 포함»하고 있다. “Состав и Структура Корпуса,” 31. 10. 2023, https://ruscorpora.ru/page/corpora-structure/. [본문으로]
  4. 기존에 사용되던 값인 Dice를 개량하여 Rychly(2008)가 발표한 것으로, “다양한 코퍼스 사이즈에 잘 대응하는 합리적인 변환값을 나타내며, 서브코퍼스에도 안정적으로 작동하며, 값 또한 합리적인 범위 내에 있다.” (Rychlý 2008, 7) [본문으로]
  5. https://dictionary.cambridge.org/dictionary/english-russian/. [본문으로]
  6. 단, 해당 연구가 영어, 스웨덴어, 러시아어(인도유럽어족)와는 어족 수준에서 다르다고 여겨지는 튀르키예어(튀르크어족)를 분석의 기준으로 삼고 있음에 유의하여야 한다. [본문으로]
반응형