동음이의어는 왜 사라지지 않을까? - 꿀잼 심리언어학 실험, accidental gap의 쓸모

언어학

동음이의어는 왜 사라지지 않을까? - 꿀잼 심리언어학 실험, accidental gap의 쓸모

cha5ylkhan 2023. 3. 15. 00:30

1. 동음이의어의 비효율성 의혹

국어를 공부할 때든 외국어를 공부할 때든 언어에 동음이의어가 아주 많이 있다는 사실은 어렵지 않게 알 수 있다.

곱씹어 보면 이상한 일이다. 동음이의어는 언어 사용을 아주 불편하게 만드는 비효율적인 존재 아닌가?

한국어의 발음 규칙이 만들어낼 수 있는 모든 음절이 모여 하나의 공간을 이루고 있다고 상상해 보자. (기저형 기준)

비유적으로 말하자면 우리는 위와 같은 가상의 '음절 공간'을 의미의 저장 창고로 사용한다.

예를 들면 '가'라는 음절에는 'go'라는 의미를, '같'이라는 음절에는 'same'이라는 의미를 저장해 두고 필요할 때마다 꺼내 사용하는 것이다. (컴퓨터의 작동 방식과 비슷하다고 상상해 볼 수 있다.)

그런데 우리가 이 '음절 공간'이라는 의미 저장 창고를 사용하는 방식은 한심하리만치 비효율적이다.

위 사진에서, 국어에서 그 자체로 의미가 있거나 다음절 단어/형태소 안에 사용되는 음절만 대강 추리면 이렇게 된다.

국어에서 의미를 전달하는 데에 사용하지 않는 음절은 빨갛게 그어 버렸다.

딱 보기에도 의미가 있는/국어에서 실제로 사용되는 음절보다 의미가 없는/국어에서 사용되지 않는 음절이 훨씬 더 많다.

음절 공간이 실제로 수용할 수 있는 의미의 양은 엄청나게 많은데,

우리는 기껏 있는 공간을 듬성듬성 다 버려 두고 극히 일부 공간에만 의미를 저장해 두는 것이다.

더욱 놀라운 점은 따로 있다. 국어에 '동음이의어'가 있다는 사실이다.

음절 공간에 빈 자리가 저렇게 많은데도 굳이굳이 하나의 음절 칸에 여러 개의 의미를 꾸역꾸역 욱여넣어 저장한다는 사실은 정말 놀랍지 않을 수가 없다.

숫자 '이(二)', 치아를 나타내는 '이[齒]', 머리에 사는 곤충 '이[虱]', 사람을 나타내는 의존명사 '이[者]',
먹는 배[梨], 몸의 배[腹], 타는 배[船],
멍멍 짖는 '개[犬]'와 물건을 세는 단위 '개(個)', ...

찾자면 끝도 없다.

이제부터 이 비효율성에 대한 의문을 나름대로 해소해 보도록 하겠다.

2. 어떤 소리는 발음하기 더 쉽다

언어 사용자가 ‘경제성’을 추구한다는 것은 ‘귀찮은(화자의 에너지가 소요되는) 일을 하지 않는 것’이다. 그러니까 경제성 추구는 곧 에너지를 절약하고자 하는 것이기도 하다.

말을 할 때 에너지를 절약하는 방법으로는 아마 이런 것들이 있을 것이다.

1. 공기의 흐름(기류)을 최대한 방해하지 않기

2. 입을 최대한 덜 움직이기

...

‘1. 공기의 흐름을 최대한 방해하지 않기’에 대해, 자음은 모음보다 기류를 더 많이 방해하고, 그 중에서도 파열음, 파찰음 등의 장애음(obstruent)은 더욱 심하다.

그러니까 거칠게 말해서 어떤 음절이 자음을 덜 사용하고 모음을 더 사용하면 그 반대의 음절보다 에너지를 조금만 소요할 것이다.

이를테면, 아마도 ‘비’가 ‘이’보다는 조금이라도 에너지를 더 사용할 것이다. (별도의 검증을 요하겠으나 직관으로 말해 본다. 이 주장도 그렇고 이하의 주장들도, [ceteris paribus 다른 조건이 같다면]을 전제한 표현들이다.)

‘2. 입을 최대한 움직이지 않기’를 생각해 보자. 어떤 음절을 발음하는 동안 입을 움직인다는 것, 입의 모양에 변화가 생긴다는 것은 음운론적으로 어떤 의미인가?

예를 들어 보자.

‘아.아’를 발음하는 동안 입의 모양은 바뀌지 않는다. (뜨.아의 반의어)

반면 ‘값을’을 발음하는 동안에는 입의 모양이 변화무쌍하다.

그러니까 똑같이 2음절이라 해도 ‘아.아’랑 ‘값을’ 중에서는 ‘아.아’보다 ‘값을’에서 에너지 소모가 조금이라도 더 클 거라고 생각할 수 있다. (마찬가지로 엄밀하게는 별도의 검증이 필요한 주제이겠지만, 나름대로 직관적으로 그럴듯해 보인다.)

좀더 일반화하자면 ‘자음군’이나 ‘받침’이나 ‘이중~삼중모음’이 있는 음절을 발음할 때는

자음 하나와 모음 하나로만, 또는 모음 하나로만 이루어진 음절을 발음할 때보다 입을 더 움직이고,

따라서 에너지를 더 소모할 것이다.

이와 관련해서 재미있는 이야기가 하나 있다.

계통적으로 연관되지 않은 세계의 수많은 언어에서 ‘엄마’를 가리키는 말에는 [m] 발음이 관찰된다.

이 또한 경제성 추구의 차원에서 생각해 볼 수 있다.

입을 다문 채로 성대를 떨면서 공기를 내보내기만 하면 기류가 비강으로 나가면서 [mmmm] 소리가 난다.

구강구조나 구강에 대한 세세한 제어 능력이 덜 발달한 아기의 입장에서 힘 안 들이고 발음하기 가장 쉬운 자음은 [m]일 것이다. 범언어적으로 ‘엄마’에 [m]이 관찰되는 데에는 이러한 이유가 있을지도 모른다. (전에 어디서 들은 것 같은데 출처가 잘 기억나지 않는다.)

정리하자면, ‘어떤 음절(또는 음절 연쇄)은 더 발음하기 쉽다.'

그러니까 위에서 우리가 본 가상의 음절 공간은 실제로는 각 칸이 균등하게 나누어진 공간이 아니다. 발음하기 어려운 음절에 의미를 배당하려면 그만큼 에너지를 사용해야 할 것이므로 그런 음절은 회피될 것이고, 발음하기 쉬운 음절이 반복적으로 선호될 것이다.

위에서 살펴본 '이', '배', '개' 등의 동음이의어들이 다들 받침 없는 CV형태인 것도 의미심장해 보이는데, 실제로 계량해 본 것은 아니므로 당장 어떤 주장을 하기는 어렵다.

동음이의어와 음절공간 활용의 비효율성(?)이 유지되는 이유는 이게 다가 아니다.

3. 우리는 들리는 대로 듣지 않는다

우리가 실제로 언어를 사용하여 의사소통하는 상황은 생각보다 그다지 깔끔하거나 안전하지가 못하다.

대화 공간이 너무 시끄러워서 몇 음절씩 말소리가 묻히거나, 말하는 사람이 말을 너무 작게 하거나, 말하는 사람의 발음이 어눌하거나, 듣는 사람이 집중을 못 하거나, 두 사람 사이 거리가 멀어서 전달이 안 되거나 하는 일은 언제든지 일어난다. 오히려 내가 하는 말이 상대방에게 100% 그대로 전달되는 상황이 좀처럼 없다고 말하는 편이 정확할 것이다.

우리 뇌는 이러한 환경에 대한 대응책을 갖춰 왔다.

귀에 들어오는 소리를 있는 그대로 인식하기보다, 다양한 요인에 의해 소리가 왜곡되었을 가능성을 고려하는 무의식적 보정(복원) 장치를 마련하고 있는 것이다.

위 영상의 음성은 '바베큐'만 반복되지만 화면에 나오는 글씨를 보고 있으면 마치 그 단어를 말하는 것처럼 들린다.

뇌가 귀로 들어오는 음성을 있는 그대로 받아들이지 않고 모종의 수정을 가하고 있는 것이다.

이런 '몬더그린' 현상 또한 뇌가 음성의 왜곡에 대응하여 보정을 시도하기 때문에 일어나는 일이다.

Warren & Warren(1970)의 유명한 심리언어학 연구에서는 아래와 같은 실험이 이루어졌다.

실험 참여자들은 아래와 같은 문장을 귀로 듣고 본인이 어떤 소리를 들었는지 대답하였는데,

It was found that the ?eel was on the axle.
It was found that the ?eel was on the shoe.
It was found that ?eel was on the orange.
It was found that ?eel was on the table.

실제로 '?eel'은 '?'부분에 아무런 언어음도 들리지 않고 잡음만 들어가 있는 음성이었음에도 불구하고,

실험 참여자들은 문맥에 따라 각각의 문장에서 'wheel, heel, peel, meal'이라는 단어를 들었다고 대답하였다.

참여자들의 뇌가 실제로는 있지도 않은 소리를 마음대로 생각해 내었고, 참여자들은 그 소리를 들었다고 대답한 것이다.

(이런 것을 음소 복원 효과phonemic restoration effect라고 한다.)

그야말로 듣는 대로 듣지 못하는 것이 우리 뇌이다.

그런데 이것이 음절 공간을 비효율적으로 활용하는 것과 무슨 상관일까?

당신이 어떤 단어를 들었는데 상대가 뭐라고 말했는지 확신이 안 선다고 해 보자.

당신이 들은 단어가 딱 한 음절이라는 것과

그 음절에 초성 자음이 있다는 것은 확실하고,

중성 ‘ㅠ’ 와 종성 ‘ㄹ’은 확실히 들었는데

초성이 무엇인지만 헷갈리는 상황이라고 가정하자.

이제 당신의 뇌는 ‘?ㅠㄹ’에서 ‘?’에 들어갈 자음을 찾아내야 한다.

(실제로는 음소가 물리적 음성으로 실현되는 양상이 인접 음소의 영향을 많이 받기 때문에 뭔가를 못 듣는 상황이 이렇게 음소 단위로 딱딱 나뉘어 일어나지는 않는다. 또 언어 바깥의 맥락으로부터 얻는 정보의 양과 질도 엄청난 영향을 미치지만, 설명을 위해 단순화해 본다.)

당신이 한국어의 원어민이라면

'*뷸, *쥴, *듈, *슐, *뮬, *뉼, *큘, *튤, *츌, *퓰, ...' 등의 음절이 한국어에서 의미를 갖는 단어가 아니라는 사실을 알고 있을 것이다.

뇌가 작동하는 방식이 정확히 어떤지 잘은 몰라도,

이런 상황에서 한국어 단어 '?ㅠㄹ'의 '?'에 들어갈 자음을 찾는 과제는 너무 쉽게만 느껴진다.

정답은 아마도 '귤'일 것이다.

다른 후보들이 너무 터무니없기 때문에 뇌는 답을 금방 찾아낼 수 있다.

(사실 '귤'의 실제 음성적 실현을 고려하면 '줄' 정도는 함께 후보에 들어갈 만하다. '귤'과 '줄'은 음운 레벨에서는 두 개의 음소가 다르지만 음성 레벨에서는 서로 매우 가깝다.)

이렇게 많은 후보가 시작부터 이미 걸러져서 나오기 때문에 비로소 뇌의 복원 작업은 수월하게 이루어질 수 있는 것이다.

실제로 이러한 문제와 관련 있는 언어학자들의 연구도 있다. 어려운 말로 '음운 이웃이 많은 단어는 느리고 부정확하게 인지된다.'고 하는데, 더 관심이 있는 독자는 링크된 'sleepy_wug'님의 티스토리 블로그 글을 읽어 보면 좋겠다.

한편 이렇게 뇌가 제멋대로 언어 정보를 왜곡하여 받아들이고 '복원'하는 현상은 시각적으로도 확인된다.

Rumelhart and McClelland(1987: 8). 색깔은 직접 입혔다.

위 사진에서 같은 색으로 된 글자들은 서로 정확히 똑같은 모양으로 되어 있다.

그런데도 우리 뇌는 각 글자의 주변에 어떤 글자가 있느냐에 따라서

빨간색 글씨는 H로 읽었다 A로 읽었다 하고,
분홍색 글씨는 R로 읽었다 P로 읽었다 하고,
노란색 글씨는 E로 읽었다 F로 읽었다 하고,
파란색 글씨는 D로 읽었다 B로 읽었다 한다.

뇌가 이러한 작업을 잘 수행할 수 있는 이유 또한

잠재적 후보가 되는 '*tae, *cht, *ped, *srot, *eish, *dedt' 등의 문자열이 영어에서 의미를 갖는 형태소나 단어로 사용되지 않는 공백(gap)이기 때문일 것이다.

+ 음운 규칙에 위배되어 애초부터 존재할 수 없는 음소열은 systematic gap이라고 하고, 음운 규칙에는 부합하지만 의미를 지닌 형태소로 사용되지 않을 뿐인 음소열은 accidental gap이라고 한다.

(위에 나오는 것들은 문자열이긴 하지만) '*cht'나 '*srot' 등은 systematic gap에 가까워 보이고, 나머지는 accidental gap이라 할 만해 보인다.

정리하자면, 우리가 어떤 소리를 듣고 그 소리열이 언어적으로 어떤 항목에 대응되는지 찾아내는('재인recognition') 작업을 할 때는 후보가 적을수록 작업이 수월해진다.

한국어의 가능한 음절 가짓수 중에 형태소에 사용되지 않는 음절이 더 많은 데에도 이러한 이유가 작용할 것이다. 수많은 음절 유형을 미리 걸러 두고 복원 작업을 시작하는 뇌는 꽤 쓸만한 성능을 보이고 있다.

다음 이야기도 아주 중요하고 흥미롭다.

4. 자연 언어는 도서관 서지 분류 기호가 아니다(!)

이 글의 질문에 제대로 답하려면 이 절의 내용을 이해하는 것이 가장 중요할지도 모른다.

이 절의 뼈대를 구상하는 데에는 평소에도 수많은 가르침을 주시는 언어학 톡방 방장님의 도움이 핵심적이었다.

물론 세부 내용은 별다른 검수 없이 스스로 썼으므로 모든 오류와 비약은 온전히 나의 것이다.

도서관 서지 분류 기호를 보면, 비슷한 주제를 다루는 책은 비슷하게 표시되도록 되어 있다.

예를 들어 문학 책이라면 모두 '8__'의 형태를 갖도록 되어 있는데, 세부적으로 '한국 문학'이라면 '810', '중국 문학'이라면 '820', ... 하는 식이다.

이러한 방식의 정보 표시는 어떤 목표 항목을 찬찬히 검색하는 사람에게는 매우 유용하겠지만,

실시간으로 소리 입력값을 받고 빠른 시간 안에 목표 단어와의 매칭을 특정해야 하는 자연언어 사용자에게는 큰 불편을 초래할 수 있다.

상상을 해 보자.

만약 우리가 사용하는 언어가 도서관 분류 기호와 같았다면 대략 이런 방식이었을 것이다.

예를 들어 '포유류'라는 범주에 속하는 단어는 모두 'ㅁ-'이라는 초성을 갖고,

그 중에 '개과(科)' 동물 이름은 모두 'ㅏ'라는 모음을 갖고,

그 중에 '늑대'라면 '-ㄱ' 받침, '개'라면 '-ㄴ' 받침이라고 해 보자.

다시 한 단계 올라가서 '고양이과'의 동물 이름은 모두 'ㅣ'라는 모음을 갖고,

그 중에 '호랑이'라면 '-ㄱ' 받침, '사자'라면 '-ㄴ' 받침, '고양이'라면 '-ㄷ' 받침을 갖는다고 해 보자.

그러면 '늑대', '개', '호랑이', '사자', '고양이'를 나타내는 말은 각각

'막, 만, 믹, 민, 믿'이 될 것이다.

'막 - 늑대', '만 - 개', '믹 - 호랑이', '민 - 사자', '믿 - 고양이'.

처음 접하는 인공언어라는 사실을 고려하더라도, 인간이 저 다섯 개의 개념과 다섯 개의 음절 매칭을 빠르게 습득하고 유창하게 사용하기란 여간 어려운 일이 아닐 것으로 보인다.

어찌어찌 암기에 성공했다고 쳐 보자. 과연 이 체계는 쓸모있는(유용한) 체계일까?

A라는 사람이 길을 가다가 호랑이가 있는 방향으로 가게 되었다.

그걸 발견한 B라는 사람이 A에게 허겁지겁 '믹! 믹!'이라고 경고를 했다.

A는 과연 '호랑이'를 바로 인지해 낼 수 있을까? '믿'이라고 잘못 들어서 '내가 가는 방향에 고양이가 있구나'라고 착각할 가능성을 배제할 수 없다.

(써놓고 보니 '믹! 믹!'은 꽤 귀여운 경고음이다.)

다시 말해 서지 기호와 같은 언어는 의사소통의 '명확성'을 담보할 수 없는 체계가 되는 것이다.

한 마디로, 인간이 사용하는 자연언어에서는

'의미가 비슷한 개념일수록 오히려 서로 분명하게 구분되는 형식을 배당'하는 편이 더 쓸모있다. 혹시 모를 혼동을 방지할 수 있는 것이다.

'딸'과 '아들'은 의미상 서로 꽤 비슷한 개념인데도 발음상으로는 서로 닮은 구석을 찾아보기가 어렵다.

'오빠'와 '언니', '동생'도 그렇다.

반대로 의미가 너무 달라서 별로 혼동의 여지가 없다면?

그 때는 두 개의 의미에 굳이 서로 다른 형식을 배당할 필요가 없을 것이다.

오히려 2절에서 말한 '발음하기 쉬운 음절'을 한번에 여러 개의 개념에 짝지어서 에너지를 절약할 수도 있다. 즉 동음이의어를 사용하는 것이다.

('이'와 같이 발음하기 쉬운 음절에 二, 虱, 齒, ...처럼 수많은 - 그러나 의미와 용처가 각각 분명하게 구분되는 - 개념이 짝지어져 있는 것은 우연이 아닐 테다.)

'눈目'과 '눈雪'이 (음장을 사용하지 않는 나의 개인어와 같은 한국어 variety라면) 서로 같은 소리로 발음되더라도 워낙 의미가 다르고 각각을 사용하는 맥락(사용처)이 다르기 때문에,

위의 '호랑이 - 고양이' 상황에서처럼 두 의미가 서로 혼동되는 시나리오는 좀처럼 상상하기 어렵다.

종합해 보자면, 동음이의어를 활용하는 것은 애초에 제기했던 의문과 반대로 오히려 경제성과 명확성을 함께 추구하는 언어사용자들의 무의식적 요구와 반응이 켜켜이 쌓여 만들어진 흥미롭고 유용한 현상이라 할 수 있겠다.

+ 3절과 유관하지만 조금 다른 개념으로 'cue validity'라는 것이 있다.

내가 아는 대로 말하자면 "인접한 항목들과 다른 점이 분명하고 많을수록 적은 에너지만으로도 빠르게 추려낼 수가 있다"는 것과 관련된 개념이다.

++ 요즘 풀 야근이었지만, 간만에 모처럼 재미있는 글이 써질 것 같아서 주말과 요 며칠 퇴근길 지하철 시간을 활용해 열심히 적어 보았다.

+++ 언어의 현재 상태가 적응의 결과물이라는 믿음, 다시 말해서 언어의 현재 상태에는 어떤 쓸모(기능)를 추구한 결과가 반영되어 있다는 사상은 기능주의 언어학이 품고 있는 철학적 가정이다. 진화심리학이 다양한 현상을 대하는 방향과 유사하기도 하다.

촘스키언 언어학도 진화에 관심이 많지만 그쪽은 언어의 발생이나 복잡성과 연관지어 좀더 메타이론적으로 생각했던 것 같고, 잘은 모르지만 약간 초점이 다른 것 같다.

이상에서 인용한 자료들의 출처는 아래와 같다.

- 색깔 입힌 글자 혼동 사진:

David E. Rumelhart; James L. McClelland, "The Appeal of Parallel Distributed Processing," in Parallel Distributed Processing: Explorations in the Microstructure of Cognition: Foundations , MIT Press, 1987, pp.3-44.

8쪽의 figure 2

- ?eel 실험: Warren & Warren(1970)... 논문이 여러 개 검색되는데 원문이 어느 쪽인지 잘 모르겠다.

같은 연구자의 또 다른 실험에서는 실험 참여자들이 일부 음소가 잡음으로 대체되었다는 사실을 아예 눈치채지도 못했다고 한다.

'?ㅏㄹ' 틀에서 '칼', '살', '팔'을 가지고 비슷한 실험을 재현해 보려고 했는데 뭔가를 잘못 했는지 제대로 되지는 않았다.

- 이상의 두 연구는 2020년 1학기에 외대 교양 강의로 수강한 황보현진 교수님의 <심리언어학> 수업을 통해 접했다.

- sleepy_wug님의 티스토리 블로그 글

이 글 말고도 언어학을 좋아하고 언어학과 관련한 진로를 계획하는 사람에게 좋은 글이 많이 있다.

https://linguisting.tistory.com/71

멀리서 봤을 때 비로소 보이는 언어간 공통점

0. 요약 너무나 당연하지만 인종/국가/사용언어에 무관하게 인간은 인지능력 상 동일하고 평등한 존재이며 그래서 언어는 보편적이다. 인간의 한계는 언어적 한계로 나타나고, 인간의 능력만큼

linguisting.tistory.com

+ 함께 읽으면 좋은 (내) 글

https://blog.naver.com/ks1127zzang/222760592516

언어의 경제성과 명확성의 경쟁 - 정보 전달 게임 [언어학]

언어 사용의 목적을 정보 전달이라 하자. 사람은 정보 전달이라는 미션을 수행하기 위해 언어라는 도구를 ...

blog.naver.com

읽어 주셔서 감사합니다.

오류와 비약에 대해서는 거침없이 지적해 주시기를 부탁드립니다.

+ ‘믹! 믹!’에서 예시한 것과 비슷한 스타일의 인공 언어가 실제로 몇 개 있다고 한다.

'언어학' 카테고리의 다른 글

같은 동작 수어(수화)가 나라에 따라 전혀 다른 의미가 되는 단어들 (0)	2023.05.21
브런치 작가 4수 합격생은 무슨 글을 제출했을까? - 시각 자료? (2)	2023.04.02
[학교에서는 못 배우는 국어 문법] 예사소리와 거센소리의 음높이 차이 (Praat) (0)	2023.03.05
한국어 성조? 지금 이 순간의 언어변화 - Praat으로 음높이 조절하여 예사소리를 거센소리로 만들기 (0)	2023.03.04
[Praat, 음성학] '칼'을 '깔'로 변형하기 (0)	2023.03.01

현재글동음이의어는 왜 사라지지 않을까? - 꿀잼 심리언어학 실험, accidental gap의 쓸모

언어학, 과학철학에 동경과 선망을 가지고 틈날 때 공부를 하는 직장인입니다. 외국어와 수어도 좋아합니다. 외대에서 베트남어 전공 및 영어 부전공을, 외고에서 러시아어 전공을 했었습니다. 제가 헛소리를 할 때는 사정없이 교정해 주시고 가르쳐 주시면 감사하겠습니다.

문법, 국어문법, 언어학, 어학, 언어유형론, 언매, 수화, 음운론, 음성학, 외국어, KimTinh, 국어, 언어와매체, 중국어, 구문문법, 수어문자, 영어, TinhKim, Linguistics, 수어,

Today :
Yesterday :

언어학, 외국어, 金星