[파이썬] KoNLPy를 통해서 단어 빈도수 계산하기

안녕하세요.

오늘은 텍스트 문서에서 단어의 빈도가 얼마나 되는지 알아보는 프로그램을 짜보도록 하겠습니다.

아래 링크에서 KoBNLPy를 다운로드 받을 수 있습니다.

konlpy.org/ko/latest/

 

KoNLPy: 파이썬 한국어 NLP — KoNLPy 0.5.2 documentation

KoNLPy: 파이썬 한국어 NLP KoNLPy("코엔엘파이"라고 읽습니다)는 한국어 정보처리를 위한 파이썬 패키지입니다. 설치법은 이 곳을 참고해주세요. NLP를 처음 시작하시는 분들은 시작하기 에서 가볍게

konlpy.org

etc-image-0

설치 방법

홈페이지의 가이드에 따라서 설치하면 되는데요.

1. 파이선을 설치하고, JDK 설치한뒤, JAVA HOME, JPype 설치후 최종적으로 KoNLPY 됩니다.

etc-image-1

 다만 언제나 나에게 쉽지 않기 때문에 ㅠㅠ

저는 64비트에서는 절때 안되고, 32bit 파이썬에 JAVA 8(1.8버전)그리고 맞는 JPype를 설치하고 실행되었습니다 ㅠ

자바홈은 컴퓨터 -> 고급 -> 환경변수에서 입력하면 되구요.

java.PNG

하단에 Path에 파이썬과 파이선 스크립트 경로를 써주셔야지 PIP를 CMD에서 바로 입력이 가능합니다.

JPype는 아래처럼 CP다음이 파이썬 버전, win다음이 비트이니 저는 32비트 깔고 되었습니다. 참고하세요.

etc-image-3

그리고 실제 사용 예제는 하단 블로그에 워낙 잘 설명되어 있어서 보시고 따라하시면 손쉽게 만들 수 있습니다.

liveyourit.tistory.com/57

 

파이썬 KoNLPy를 사용한 한글 명사 추출 및 빈도 계산

KoNLPy 란 아무래도 언어마다 자연어처리를 하기 위한 특성이 제각각이다보니 영어에 맞춰진 자연어처리 도구를 사용하기는 한글에는 맞지 않는다. 그런 이유에서 한글 자연어 처리에 맞춤화된

liveyourit.tistory.com

www.itkc.or.kr/bbs/boardView.do?id=75&bIdx=33813&page=1&menuId=128&bc=7

 

한국고전번역원

한국고전번역원

www.itkc.or.kr

아래의 고전 칼럼을 돌려도면 아래와 같은 결과가 나옵니다.

코드는 저 위에 블로그에서 너무나 잘 설명해주셔서 별도로 설명하진 않겠습니다.

etc-image-4

 

728x90

해당 블로그에서 발행되는 콘텐츠 중 일부 글에는 제휴 및 홍보 관련 링크가 포함될 수 있으며, 파트너스 활동의 일환으로 일정액의 수수료를 받을 수 있습니다.

dorudoru님의
글이 좋았다면 응원을 보내주세요!