코퍼스 3

'빠르다~이르다'와 '느리다~늦다'의 비대칭 - 코퍼스, 의미 지도와 CLICS, 속도와 시점의 다의성

나는 가끔 의도치 않게 불을 켠 채로 잠이 든다. (이 글에서 이야기했듯) 결혼을 하고 나서도 이 습관은 덜 고쳐져서, 가끔 아내가 먼저 잠들면 옆에서 스마트폰을 만지거나 책을 보다가 불을 미처 못 끄고 잠들어 버리곤 한다. 몹시 미안하게도, 그럴 때는 아내가 새벽에 깨서 불을 끄고는 다시 잠든다. 아침에 일어나서 상황 파악을 하고 나면, 내 부주의 때문에 나 자신도 아내도 제대로 푹 쉴 기회를 놓쳐 버렸다는 자책이 내게 상당한 스트레스로 다가온다. (이런 상황이면 아내는 나를 원망할 법도 한데, 자기는 불을 켠 채로 자는 것에 대해서 딱히 아무렇지도 않다면서 늘 무덤덤하게 넘겨 준다.) '불 키다' 글을 썼던 날도 딱 그런 상황이었다. (생각해 보니 그 날이 설날이었다. 날짜 감각이...) '몇 시에 ..

언어학 2024.02.11

언어 사용자는 종종 기꺼이 귀찮음을 참는다 - 코퍼스로 엿보는 동음이의어와 음운 이웃 회피(feat. '줄은')

1. 줄은? 준? 35쪽 최근에 교보문고에서 광고하던 일본의 미스테리 소설 을 사서 읽다가 재미있는 걸 발견했다. 괜찮다. 신경 쓸 일이 하나 줄은 건 좋은 것 아닌가. '줄은'에 주목해 보자. ​ 표준어 기준 ‘줄다’의 관형사형은 현재시제에서 ‘주는’, 과거시제에서 ‘준’이다. 규범에 따르면 어간 말음이 /ㄹ/인 용언들은 /ㄴ/, /ㅂ/, /ㅅ/으로 시작하는 어미 앞에서 예외 없이 /ㄹ/이 탈락하는 활용을 하기 때문이다. 국립국어원 트위터에서도 이러한 입장을 확인할 수 있다. https://twitter.com/urimal365/status/222599850062127104 트위터에서 즐기는 국립국어원 “‘확연히 준 것’이 적절한 표현입니다. ‘줄다’처럼 ‘ㄹ’ 받침인 동사 어간에 관형사형 어미 ‘-ㄴ..

언어학 2023.07.09

세종코퍼스 txt 파일에서 어절 수 찾아내기

이렇게 생긴 세종코퍼스 txt 파일로부터 코퍼스의 어절 수를 추출해 내는 기능을 만들어 보려다가 헤맸었다. 약간의 혼란 끝에 드디어 어떻게든 성공했다. 생각해 보니까 그냥 txt 파일의 맨 밑 줄부터 탐색해서 여는꺾쇠(' 최종 코드는 이렇게 만들어졌다.잘하는 분들이 보기엔 엉망이겠지만 일단 돌아가니까 만족이다.1234567891011121314151617181920212223242526272829303132333435363738394041import reimport syssys.stdout = open('stdout.txt', 'w')def counter(x):    f = open(x, "r", encoding="utf-16-le")    data = f.readlines()    for i in ra..

언어학 2022.07.24