데이터 전처리 데이터를 불러오고 전처리하는 과정이다. 데이터에 기본적인 필요없는 부분을 제거하고, 문장을 단어들로 나눈다. import pandas as pd import numpy as np from sklearn.model_selection import train_test_split spam_data = pd.read_csv("../data/spam.csv", encoding="latin1") # spam, ham 값을 숫자로 변환 spam_data['v1'] = spam_data['v1'].replace('spam', 1) spam_data['v1'] = spam_data['v1'].replace('ham', 0) # 정규표현식을 써서, 단어가 아니면 공백으로 spam_data['v2'] = spa..