목록사이킷런 (3)
말랑말랑제리스타일
딥러닝에서 모델 생성을 완료했다면 어느 정도 정확도를 내는지 성능을 평가해야 되겠죠. 총 4가지 단계를 통해서 딥러닝 ANN 모델의 성능을 평가해 봤습니다. 여기서 과적합을 판단하는 방법도 알 수 있었는데 두 번째 단락에서 과적합의 의미를 설명드리겠습니다. ANN 모델의 학습 결과 출력 이미 model.fit을 통해 결과를 확인했겠지만 이 결과를 epoch(반복 횟수) 별로 히스토리에 저장해 둘 수 있습니다. history = model.fit(train_x, train_y, epochs=50, batch_size=50, validation_data=(valid_x,valid_y)) 이렇게 model.fit의 결과를 변수에 받아볼 수 있는데요. 저는 50회 epoch를 주고 history라는 변수에 저장..
데이터 분석을 하다보면 Nan 값 즉, 비어있는 값을 자주 보게 됩니다. 이런 Nan 값을 채우기 위해서 fillna 또는 SimpleImputer를 사용할 수 있는데요. 차이점은 SimpleImputer의 경우 이름처럼 Simple 하기 때문에 fillna보다 자유도가 떨어지는 대신 간단하게 값을 채울 수 있습니다. 예를 들어 SimpleImputer는 groupby 기능을 지원하지 않죠. SimpleImputer 사용방법 그럼 지금부터 본격적으로 SimpleImputer를 사용해 Nan 값을 채우는 방법을 보여드리겠습니다. import pandas as pd from sklearn.impute import SimpleImputer #사이킷런의 SimpleImputer Import my_imputer ..
파이썬의 사이킷런 라이브러리에서 Decision Tree 즉, 결정트리를 만들기 위해서 Decisiontreeclassifier 함수를 사용하게 됩니다. 이 Decisiontreeclassifier 함수에서 사용할 수 있는 파라미터는 아래와 같은데요. criterion="squared_error", splitter="best", max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0, ccp_alpha=0 Random_state란 다른건 다 이해가 되는데 rand..