전체적으로 당신의 전공분야는 방언학이시기도 하고
음향을 대상으로 자동 분석을 시도한 본 대학의 연구자가 없었기에
오히려 자네한테 우리가 배우게 될 것이라는 대답을 많이 하셨다.
1. 자동처리와 관련한 러시아 언어학 내 흐름
('본인 분야의 연구사' 주제의 철학 레포트를 잘 적기 위한 추천)
- Мельчук부터 시작해서 ИППИ(정보전달문제연구소)라는 기관에서 발전시켜온 자동번역의 역사를 다루면 좋겠다.
- Кодзасов & Кривнова의 새천년 이후 연구도 참고하라.
- 서방 학자 Fant & Halle를 참조하고,
- Ladefoged 등등 유명한 음성학 입문 교과서에도 역사 관련 내용이 있을 것이다.
- 음향 처리는 Сбер(은행)에서 진행하는 상업 프로젝트 (졸업생 Шаврина가 업계에서 유명) 갈래가 있고
- 학술 쪽에서는 잘 모르겠다. 아마 서방 학자들을 참고할 수밖에 없을 듯하다.
- Брызгунова는 ИК를 고안한 사람은 맞는데... 그 전/후의 비슷한 시도는 없는 듯하다.
2. 연구계획 관련
1. 전처리 및 코퍼스 관련
- GPT로 ИК 구분을 전처리 시도하는 건 좋은 생각인 것 같다. 설사 실패한다고 할지라도 '인공지능의 러시아어 텍스트 감지 능력'에 대한 실험이 되는 것이니 아이디어를 버리지 마라.
- (물음표가 있는 RUSLAN 코퍼스를 쓰는 게 좋겠냐는 질문에, 샘플을 들어보시고) TTS용이라 그런지 너무 '연극 발성' 같다. 별로 좋은 자료는 아닌 듯하다.
- 여러 러시아 연구자들이 만든 Spoken Corpus라는 코퍼스 프로젝트를 인용하는 게 좋겠다. 오히려 안 쓰면 '왜 안 썼냐'는 질문을 받을 정도로 공들여 만든 자료인데다가, 그 해설서가 참고서의 정석이라고 할 수 있을 정도이다. ELAN이라는, 텍스트그리드의 상위호환격 문법으로 주석이 달려 있다.
2. 딥러닝(ToRI 샘플 이용) or 알고리즘 기반(AuToBI + P_ToBI_transcriber)
- 어떤 걸로 가든 인간 검증이 중요할 것 같은데 혼자 하면 자네가 '망가질' 것 같다.
- 그리고 원어민의 언어적 직관이 필요하기도 하다
- 학과장 허락을 얻어서 학생들 몇 명 자원을 받아 논문에 공저자로 올리는 조건 등으로 같이 검증 하는 게 좋겠다.
3. 피치 악센트의 측정 위치
- 발화 전체로도 시도해보고 돋들림단어의 강세음절로도 측정해본 다음 비교해보는 게 좋겠다.
- 인간의 직관과 기계의 판단이 다를 수 있다. 꼭 강세 음절에 피치 악센트가 오는 것이 아니다! (예: ПРОчитай)
- 한 문장이 사실 두 개의 발화단위일 수 있다. 그렇다면 두 개의 피치 악센트를 잡아야 하는 것이다. 그러므로 EDU(Elementary Discourse Unit)이라는 개념을 적용할 수 있다면 더 좋겠다.
4. 최종 연구 목적
- 당연히 ИК-2, 3 간에는 돋들림 단어의 위치 외의 다른 음향적 지표의 차이가 존재할 것으로 가정하는 게 맞다.
- 그러나 정확히 어떤 음향적 지표를 제시해야 하는 지는 생각을 해봐야 할 것 같다.
- 최종적인 결과의 제시는 (1) 최소대립쌍(minimal pair) (2) 대립을 잘 보여주는 예문 (3) 원어민 판단 + 라벨링된 코퍼스 세 가지로 이루어져야 한다.
'러시아 > 학업과 진로' 카테고리의 다른 글
| 박사논문 주제에 대한 수정된 생각 (4) | 2025.11.24 |
|---|---|
| 박사논문 주제에 관한 초기 고찰 (2) | 2025.11.17 |
| 진학 대학 고민 및 국비장학 결과 발표 (3) | 2025.07.24 |
| 앓으면서 맞이하는 모스크바의 주말 (2) | 2025.06.22 |
| 제2입학시험 전 쓰는 글 (1) | 2025.06.19 |