반응형
특수문자 제거
- 보통 특수문자는 문장의 의미에 큰 역할을 하지 않는다.
- 따라서 전처리 과정으로 특수문자를 제거할 수 있다.
from string import punctuation
for p in punctuation :
print(p)
data = data.replace(p, "")
- data에 내가 제거를 원하는 데이터(문자열)이 있다고 하자.
- punctuation에는 기본적인 특수문자 데이터 (!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~)가 들어있다.
- 따라서 하나씩 체크하면서 replace 하는 것으로 특수문자를 제거할 수 있다.
반응형
'🛠 기타 > Data & AI' 카테고리의 다른 글
TensorFlow 레이어 (0) | 2020.08.07 |
---|---|
문자열 형태소 제거하기 (0) | 2020.08.06 |
[scikit-learn 라이브러리] DecisionTreeClassifier (결정트리분류기) (0) | 2020.08.05 |
LSTM을 활용한 스팸분류 (0) | 2020.08.05 |
합성곱 신경망(CNN) - 기본구조 이론 (0) | 2020.08.03 |