반응형
어간 찾기
from nltk.stem import PorterStemmer
text = """
Have you ever fallen head.
over heels for somebody.
"""
# 어간 찾기
words = word_tokenize(text)
for word in words:
print(PorterStemmer().stem(word))
==결과==
have
you
ever
fallen
head
.
over
heel
for
somebodi
.
- PorterStemmer의 stem메소드로 단어의 어간을 찾을 수 있다.
- 문장을 단어별로 토크나이징 한 뒤에 각 단어들의 어간을 for문을 통해 출력했다.
- 사실 아직 기능이 완벽하지 못해 정확한 어간을 출력해주지는 않는다.
반응형
'🛠 기타 > Data & AI' 카테고리의 다른 글
파이썬 토크나이저 - 단어 개수 세기 (0) | 2020.07.17 |
---|---|
파이썬 토크나이저 - stop words (nltk) (0) | 2020.07.17 |
Pandas 데이터프레임 pivot table (0) | 2020.07.16 |
Pandas 데이터프레임 데이터 별 함수적용 (0) | 2020.07.16 |
Pandas 데이터프레임 멀티 인덱싱 (0) | 2020.07.16 |