본문 바로가기
러시아/학업과 진로

박논 연구계획: 면담 내용 정리

by 누에고치 2025. 11. 25.

전체적으로 당신의 전공분야는 방언학이시기도 하고
음향을 대상으로 자동 분석을 시도한 본 대학의 연구자가 없었기에
오히려 자네한테 우리가 배우게 될 것이라는 대답을 많이 하셨다.
 

1. 자동처리와 관련한 러시아 언어학 내 흐름

('본인 분야의 연구사' 주제의 철학 레포트를 잘 적기 위한 추천)
- Мельчук부터 시작해서 ИППИ(정보전달문제연구소)라는 기관에서 발전시켜온 자동번역의 역사를 다루면 좋겠다.
- Кодзасов & Кривнова의 새천년 이후 연구도 참고하라.
 
- 서방 학자 Fant & Halle를 참조하고,
- Ladefoged 등등 유명한 음성학 입문 교과서에도 역사 관련 내용이 있을 것이다.
 
- 음향 처리는 Сбер(은행)에서 진행하는 상업 프로젝트 (졸업생 Шаврина가 업계에서 유명) 갈래가 있고
- 학술 쪽에서는 잘 모르겠다. 아마 서방 학자들을 참고할 수밖에 없을 듯하다.
 
- Брызгунова는 ИК를 고안한 사람은 맞는데... 그 전/후의 비슷한 시도는 없는 듯하다.
 

2. 연구계획 관련

1. 전처리 및 코퍼스 관련
- GPT로 ИК 구분을 전처리 시도하는 건 좋은 생각인 것 같다. 설사 실패한다고 할지라도 '인공지능의 러시아어 텍스트 감지 능력'에 대한 실험이 되는 것이니 아이디어를 버리지 마라.
- (물음표가 있는 RUSLAN 코퍼스를 쓰는 게 좋겠냐는 질문에, 샘플을 들어보시고) TTS용이라 그런지 너무 '연극 발성' 같다. 별로 좋은 자료는 아닌 듯하다.
- 여러 러시아 연구자들이 만든 Spoken Corpus라는 코퍼스 프로젝트를 인용하는 게 좋겠다. 오히려 안 쓰면 '왜 안 썼냐'는 질문을 받을 정도로 공들여 만든 자료인데다가, 그 해설서가 참고서의 정석이라고 할 수 있을 정도이다. ELAN이라는, 텍스트그리드의 상위호환격 문법으로 주석이 달려 있다.
 
2. 딥러닝(ToRI 샘플 이용) or 알고리즘 기반(AuToBI + P_ToBI_transcriber)
- 어떤 걸로 가든 인간 검증이 중요할 것 같은데 혼자 하면 자네가 '망가질' 것 같다.
- 그리고 원어민의 언어적 직관이 필요하기도 하다
- 학과장 허락을 얻어서 학생들 몇 명 자원을 받아 논문에 공저자로 올리는 조건 등으로 같이 검증 하는 게 좋겠다.
 
3. 피치 악센트의 측정 위치
- 발화 전체로도 시도해보고 돋들림단어의 강세음절로도 측정해본 다음 비교해보는 게 좋겠다.
- 인간의 직관과 기계의 판단이 다를 수 있다. 꼭 강세 음절에 피치 악센트가 오는 것이 아니다! (예: ПРОчитай)
- 한 문장이 사실 두 개의 발화단위일 수 있다. 그렇다면 두 개의 피치 악센트를 잡아야 하는 것이다. 그러므로 EDU(Elementary Discourse Unit)이라는 개념을 적용할 수 있다면 더 좋겠다.
 
4. 최종 연구 목적
- 당연히 ИК-2, 3 간에는 돋들림 단어의 위치 외의 다른 음향적 지표의 차이가 존재할 것으로 가정하는 게 맞다.
- 그러나 정확히 어떤 음향적 지표를 제시해야 하는 지는 생각을 해봐야 할 것 같다.
- 최종적인 결과의 제시는 (1) 최소대립쌍(minimal pair) (2) 대립을 잘 보여주는 예문 (3) 원어민 판단 + 라벨링된 코퍼스 세 가지로 이루어져야 한다.

반응형