Today I Learned/머신러닝

[자연어처리] konlpy 설치하고 불러오기

하나719 2020. 11. 20. 19:54
반응형

konlpy란?

konlpy는 한글 자연어 처리를 도와주는  java기반의 형태소 분석기들을 python에서 쓸 수 있게 도와주는 라이브러리들이다.

github link 참고

 

twitter/twitter-korean-text

Korean tokenizer. Contribute to twitter/twitter-korean-text development by creating an account on GitHub.

github.com

세팅하기

1. java 설치

konlpy는 자바기반으로 만들어졌기때문에 java를 설치해줍니다. (각자 os에 맞는 것으로 설치 필요)

java 설치하기

 

Java | Oracle

 

www.java.com

2. jdk 설치

www.oracle.com/java/technologies/javase-jdk15-downloads.html

3. 파이썬에서 konlpy 설치

윈도에서는 먼저 jpype1을 다음과 같이 설치한다. 맥, 리눅스, Colab 등에서는 생략한다.

!conda install -y -c conda-forge jpype1
!conda install konlpy 
!pip install konlpy

4. 라이브러리 불러와본다.

from konlpy.tag import Komoran
tagger = Komoran()

5. tagger로 형태소 분석하기

text = '오늘은 자연어처리 하는 날 이에요 ㅎ'
tagger.pos(text)

반응형