[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

문자열 형태소 제거하기

inu 2020. 8. 6. 17:08
반응형

mecab

from mecab import MeCab
m = MeCab()

text = "안녕하세요 적당히 바람이 시원해 기분이 너무 좋아요"

# 형태소 별로 나눠 출력
print(m.morphs(text))

# 명사만 출력
print(m.nouns(text))
==결과==
['안녕', '하', '세요', '적당히', '바람', '이', '시원', '해', '기분', '이', '너무', '좋', '아요']
['안녕', '바람', '기분']
  • 한글 라이브러리인 mecab 라이브러리를 활용한다.
  • morphs()는 문자열을 형태소와 단어로 나눠서 리스트로 반환한다.
  • nouns()는 문자열에서 형태소를 제외한 단어만 뽑아 리스트로 반환한다.
반응형