🛠 기타/Data & AI
문자열 형태소 제거하기
inu
2020. 8. 6. 17:08
mecab
from mecab import MeCab
m = MeCab()
text = "안녕하세요 적당히 바람이 시원해 기분이 너무 좋아요"
# 형태소 별로 나눠 출력
print(m.morphs(text))
# 명사만 출력
print(m.nouns(text))
==결과==
['안녕', '하', '세요', '적당히', '바람', '이', '시원', '해', '기분', '이', '너무', '좋', '아요']
['안녕', '바람', '기분']
- 한글 라이브러리인 mecab 라이브러리를 활용한다.
- morphs()는 문자열을 형태소와 단어로 나눠서 리스트로 반환한다.
- nouns()는 문자열에서 형태소를 제외한 단어만 뽑아 리스트로 반환한다.