🛠 기타/Data & AI
문자열 특수문자 제거
inu
2020. 8. 6. 14:11
특수문자 제거
- 보통 특수문자는 문장의 의미에 큰 역할을 하지 않는다.
- 따라서 전처리 과정으로 특수문자를 제거할 수 있다.
from string import punctuation
for p in punctuation :
print(p)
data = data.replace(p, "")
- data에 내가 제거를 원하는 데이터(문자열)이 있다고 하자.
- punctuation에는 기본적인 특수문자 데이터 (!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~)가 들어있다.
- 따라서 하나씩 체크하면서 replace 하는 것으로 특수문자를 제거할 수 있다.