[파이썬] KoNLPy를 통해서 단어 빈도수 계산하기

안녕하세요.

오늘은 텍스트 문서에서 단어의 빈도가 얼마나 되는지 알아보는 프로그램을 짜보도록 하겠습니다.

아래 링크에서 KoBNLPy를 다운로드 받을 수 있습니다.

konlpy.org/ko/latest/

 

KoNLPy: 파이썬 한국어 NLP — KoNLPy 0.5.2 documentation

KoNLPy: 파이썬 한국어 NLP KoNLPy("코엔엘파이"라고 읽습니다)는 한국어 정보처리를 위한 파이썬 패키지입니다. 설치법은 이 곳을 참고해주세요. NLP를 처음 시작하시는 분들은 시작하기 에서 가볍게

konlpy.org

설치 방법

홈페이지의 가이드에 따라서 설치하면 되는데요.

1. 파이선을 설치하고, JDK 설치한뒤, JAVA HOME, JPype 설치후 최종적으로 KoNLPY 됩니다.

 다만 언제나 나에게 쉽지 않기 때문에 ㅠㅠ

저는 64비트에서는 절때 안되고, 32bit 파이썬에 JAVA 8(1.8버전)그리고 맞는 JPype를 설치하고 실행되었습니다 ㅠ

자바홈은 컴퓨터 -> 고급 -> 환경변수에서 입력하면 되구요.

하단에 Path에 파이썬과 파이선 스크립트 경로를 써주셔야지 PIP를 CMD에서 바로 입력이 가능합니다.

JPype는 아래처럼 CP다음이 파이썬 버전, win다음이 비트이니 저는 32비트 깔고 되었습니다. 참고하세요.

그리고 실제 사용 예제는 하단 블로그에 워낙 잘 설명되어 있어서 보시고 따라하시면 손쉽게 만들 수 있습니다.

liveyourit.tistory.com/57

 

파이썬 KoNLPy를 사용한 한글 명사 추출 및 빈도 계산

KoNLPy 란 아무래도 언어마다 자연어처리를 하기 위한 특성이 제각각이다보니 영어에 맞춰진 자연어처리 도구를 사용하기는 한글에는 맞지 않는다. 그런 이유에서 한글 자연어 처리에 맞춤화된

liveyourit.tistory.com

www.itkc.or.kr/bbs/boardView.do?id=75&bIdx=33813&page=1&menuId=128&bc=7

 

한국고전번역원

한국고전번역원

www.itkc.or.kr

아래의 고전 칼럼을 돌려도면 아래와 같은 결과가 나옵니다.

코드는 저 위에 블로그에서 너무나 잘 설명해주셔서 별도로 설명하진 않겠습니다.

 

728x90

해당 블로그에서 발행되는 콘텐츠 중 일부 글에는 제휴 및 홍보 관련 링크가 포함될 수 있으며, 파트너스 활동의 일환으로 일정액의 수수료를 받을 수 있습니다.