'곧이곧대로'의 연어(collocation)에 대해 대략 아래와 같은 예상을 했었다.
(결과의 윤곽을 보고서 약간 입맛에 좋게 수정했지만 골자는 비슷하다)
- 문장에 '곧이곧대로'가 쓰였을 때, 그 뒤에 '믿다'가 출현하는 빈도는 우연에 의한 것보다 유의미하게 높을 것이다.
- 문장에 '곧이곧대로'가 쓰였을 때, 그 뒤에 부정의 의미가 나타나는 빈도는 우연에 의한 것보다 유의미하게 높을 것이다.
총 9,942,848어절의 세종코퍼스 현대문어 데이터를 통해 확인한 결과,
일단은 이 생각이 대강 맞는 것 같다.
아직 통계분석을 해 보지는 못했으나,
당장 내가 할 수 있는 범위 안에서는 잠정적으로 확인을 했다.
결과는 대략 아래 표와 같다.
'곧이곧대로'의 출현 빈도 | 30 (/ 9,942,848) | ||
'곧이곧대로 믿(다)'가 나타난 문장의 개수 |
10 | '곧이곧대로'가 '믿다' 외의 다른 단어를 수식한 문장의 개수 (2등~19등의 총합) |
20 |
문법적 부정문의 개수 | 14 | 문법적 긍정문의 개수 | 16 |
1. 믿다
'곧이곧대로'의 수식을 받는 용언(주로 바로 뒤에 출현) 총 19가지 중에
'믿다'가 빈도상 1등이고, 30례 중에 무려 10례를 혼자서 차지하고 있다.
2등부터 19등까지를 모두 합쳐 봤자 20례밖에 되지 않는다.
2등부터 19등까지를 순위 상관없이 나열하자면 이렇다.
해석하다, 받아들이다, 행하다, 고해바치다, 이해하다, 이다, 고수하다, 대답을 하다, 직토하다, 발고하다, 느끼다, 나타나다, 얘기하다, 말하다, 적다, 하다, 듣다, 따르다
정확한 연어값은 통계검정을 통해 확인해야겠지만,
아마도 저 정도면 매우 유의미한 연어가 아닐까 싶다.
애초에 '곧이곧대로' 자체가 저빈도 어휘라서,
통계검정을 하면 조금만 높아도 크게 측정되지 않을까? 잘은 모르겠지만
2. 부정
'부정 의미'와의 연-구문(? collostruction) 관계는 단순 빈도만 놓고 보면 그리 크지 않아 보이지만,
아래 두 가지 문제를 고려해야 한다.
- (확인해 봐야겠지만) '곧이곧대로'가 쓰이지 않는 경우에는 원래 긍정문이 부정문보다 고빈도일 것이다.
- 그나마 '곧이곧대로'가 있으니까 14:16 정도로 부정문의 비율이 높아진 것일 수 있다.
- 31례 중에, 문법적인 극성(polarity)이 긍정이더라도 맥락상 부정적인 의미로 쓰인 경우가 5례 있었다.
- 이들을 만약 부정으로 분류하면 부정:긍정의 비는 19:11이 된다.
+
사실 이런 작업에서 가장 중요한 것은
언어학 이론에 기여할 수 있는 함의를 찾는 일인데,
(이 글에서 이야기했듯이)
당장 이런 결과가 이론적으로 어떤 의미가 있는지는 잘 모르겠다.
물론 연어값 계산을 안 해봤으니 정확한 결과가 나온 건 아니지만
++
저번 글에서 말했던 '곧이곧대로'의 31례 중에,
'믿다'를 포함하는 "그래서 김씨의 말을 곧이곧대로 믿었습니다."라는 문장이 두 번 중복으로 나타났다.
확인해 보니 어떤 이유인지 똑같은 텍스트가 두 개의 txt 파일로 만들어져 있었다.
중복된 것이 23,860어절짜리 txt 파일이라 전체 어절 수도 그만큼을 감했고
'곧이곧대로'의 출현 빈도도 30으로 수정했으며
'믿다'의 빈도도 11에서 1을 감하여 10으로 했다.
1편 - https://blog.naver.com/ks1127zzang/222824981687
2편 - https://blog.naver.com/ks1127zzang/222826100700
3편 - https://blog.naver.com/ks1127zzang/222826423187
4편 - https://blog.naver.com/ks1127zzang/222834572569
'언어학' 카테고리의 다른 글
능격-절대격은 무엇이고 왜 쓰이는가? (0) | 2022.09.13 |
---|---|
'낙뢰'와 표준 발음법과 국어 교육에 관한 단상 (0) | 2022.08.06 |
세종코퍼스에서 특정 단어를 포함하는 문장 추출하기 - 연어 분석 (4) (0) | 2022.07.30 |
세종코퍼스 txt 파일에서 어절 수 찾아내기 (0) | 2022.07.24 |
사용 기반 언어학 (Usage-Based Linguistics) (0) | 2022.06.28 |