반응형
konlpy란?
konlpy는 한글 자연어 처리를 도와주는 java기반의 형태소 분석기들을 python에서 쓸 수 있게 도와주는 라이브러리들이다.
twitter/twitter-korean-text
Korean tokenizer. Contribute to twitter/twitter-korean-text development by creating an account on GitHub.
github.com
세팅하기
1. java 설치
konlpy는 자바기반으로 만들어졌기때문에 java를 설치해줍니다. (각자 os에 맞는 것으로 설치 필요)
Java | Oracle
www.java.com
2. jdk 설치
www.oracle.com/java/technologies/javase-jdk15-downloads.html
3. 파이썬에서 konlpy 설치
윈도에서는 먼저 jpype1을 다음과 같이 설치한다. 맥, 리눅스, Colab 등에서는 생략한다.
!conda install -y -c conda-forge jpype1
!conda install konlpy
!pip install konlpy
4. 라이브러리 불러와본다.
from konlpy.tag import Komoran
tagger = Komoran()
5. tagger로 형태소 분석하기
text = '오늘은 자연어처리 하는 날 이에요 ㅎ'
tagger.pos(text)
반응형
'Today I Learned > 머신러닝' 카테고리의 다른 글
[텍스트분석] 단어빈도의 가중치 TF-IDF (0) | 2020.11.27 |
---|---|
[텍스트분석] TDM (Term Document Matrix) 단어 문서 행렬 (0) | 2020.11.27 |
Cross Validation (교차검증) 이란? (0) | 2020.11.12 |
K-means Clustering with Python (0) | 2020.11.06 |
엑셀로 추천시스템 유저프로필 만들어보기 (0) | 2020.09.30 |