scikit-learn(sklearn) : 파이썬 오픈소스 라이브러리 중에서 머신러닝을 구현하는데 특화된 라이브러리
scikit-learn: machine learning in Python — scikit-learn 1.1.3 documentation
Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...
scikit-learn.org
- sklearn은 거의 대부분의 머신러닝 알고리즘들이 구현되어 있습니다.
- 굉장히 구조적으로 잘 만들어져있어서, 사용하기 편리합니다.
- 머신러닝을 위해서 만들어진 라이브러리다보니, 딥러닝을 하기에는 적합하지 않습니다
- sklearn 이후에 만들어진 대부분의 머신러닝 라이브러리들이 모두 sklearn-style을 따릅니다.
- Pycaret이나 XGBoost, LightGBM, Catboost 같은 대표적인 머신러닝 라이브러리들도 모두 sklearn에 dependency를 가지고 있습니다.
Getting Started
Getting Started
The purpose of this guide is to illustrate some of the main features that scikit-learn provides. It assumes a very basic working knowledge of machine learning practices (model fitting, predicting, ...
scikit-learn.org
- 위의 페이지를 잘 따라가면 sklearn으로 쉽게 데이터를 불러와서 학습하는 코드를 따라 만들 수 있습니다.
- sklearn의 전체적인 구현 방식에는 정해진 틀이 있습니다.
# sklearn을 사용하여 하나의 ML model을 불러와서 분류 모델을 학습하고 평가하는 예시입니다.
# 1. 사용할 모델을 불러옵니다.
from sklearn.ensemble import RandomForestClassifier
form sklearn.metrics import accuracy_score
# 2. 모델 객체를 선언합니다.
model = RandomForestClassifier()
# 3. training data로 학습을 진행합니다.
model.fit(X_train, y_train)
# 4. test data로 inference를 진행합니다.
pred = model.predict(X_test)
# 5. Evaluation metric으로 평가를 진행합니다.
print("Accuracy : %4.f" % accuracy_score(y_test, pred))
>> Accuracy : 0.8976
- 위의 코드 구현 방식은 sklearn을 사용하는 머신러닝 프로젝트에서는 공식처럼 활용되니 반드시 익혀두세요!
반응형
'Machine_Learning > 이론' 카테고리의 다른 글
Classification-02. Model 1: Linear Classifier (0) | 2022.11.03 |
---|---|
Classification-01. 분류의 정의 (0) | 2022.11.03 |
Machine Learning Workflow-01. 머신러닝 프로젝트 수행방법 (0) | 2022.11.02 |
머신러닝 기초 개념-07. evaluation metric (0) | 2022.10.28 |
머신러닝 기초 개념-06. loss function (0) | 2022.10.28 |