In [1]:
import sklearn
print(sklearn.__version__)
0.23.2
In [2]:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
데이터 세트 로딩¶
In [5]:
import pandas as pd
#붓꽃 데이터 세트 로딩
iris = load_iris()
#iris.data는 iris데이터 세트에서 피쳐만으로된 데이터를 numpy로 가지고 있음.
iris_data = iris.data
#iris.target은 붓꽃 데이터 세트에서 결정값(레이블)을 numpy로 가지고 있음.
iris_label = iris.target
print('iris target값 : ', iris_label)
print('iris target명 : ', iris.target_names)
iris_df = pd.DataFrame(data = iris_data, columns=iris.feature_names) # 붓꽃 데이터 세트 자세하기 보기위해 DataFrame으로 변환
iris_df['label'] = iris.target #label이라는 컬럼 추가
iris_df.head(3)
iris target값 : [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2] iris target명 : ['setosa' 'versicolor' 'virginica']
Out[5]:
sepal length (cm) | sepal width (cm) | petal length (cm) | petal width (cm) | label | |
---|---|---|---|---|---|
0 | 5.1 | 3.5 | 1.4 | 0.2 | 0 |
1 | 4.9 | 3.0 | 1.4 | 0.2 | 0 |
2 | 4.7 | 3.2 | 1.3 | 0.2 | 0 |
In [6]:
X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_label, test_size=0.2, random_state=11) # 학습데이터와 테스트데이터 분할하기
학습 데이터 세트로 학습 수행¶
In [8]:
# DecisionTreeClassifier 객체 생성
dt_clf = DecisionTreeClassifier(random_state=11)
# 학습 수행
dt_clf.fit(X_train, y_train)
Out[8]:
DecisionTreeClassifier(random_state=11)
테스트 데이터 세트로 예측 수행¶
In [9]:
pred = dt_clf.predict(X_test) #feature test set
In [10]:
#예측값을 반환해줌
pred
Out[10]:
array([2, 2, 1, 1, 2, 0, 1, 0, 0, 1, 1, 1, 1, 2, 2, 0, 2, 1, 2, 2, 1, 0, 0, 1, 0, 0, 2, 1, 0, 1])
예측 정확도 평가¶
In [12]:
from sklearn.metrics import accuracy_score
print('예측 정확도: {0:.4f}'.format(accuracy_score(y_test,pred)))
예측 정확도: 0.9333
'AI > Machine Learning' 카테고리의 다른 글
[파이썬 머신러닝 완벽 가이드 정리] 1. 파이썬 기반의 머신러닝과 생태계 이해 - #3 Pandas (2) Aggregation함수와 Group by 수행 (0) | 2021.02.28 |
---|---|
[파이썬 머신러닝 완벽 가이드 정리] 1. 파이썬 기반의 머신러닝과 생태계 이해 - #3 Pandas (0) | 2021.02.13 |
[파이썬 머신러닝 완벽 가이드 정리] 1. 파이썬 기반의 머신러닝과 생태계 이해 - #2 Numpy (0) | 2021.02.12 |
[파이썬 머신러닝 완벽 가이드 정리] 1. 파이썬 기반의 머신러닝과 생태계 이해 - #1 (0) | 2021.02.12 |