Source : https://developers.google.com/machine-learning/crash-course/representation/feature-engineering
RECAP
- 데이터 마트까지 구성된 데이터를 input vector라고 부릅니다. (정형화 되어 있는 수치들)
- 이 input vector를 머신러닝 모델에 사용할 feature vector로 바꾸는 작업이 feature engineering입니다.
- feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다.
- feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다.
- feature engineering을 할 때 체크해야 하는 사항들을 중점적으로 확인해야 합니다.
- feature vector가 표현되는 공간을 feature space라고 합니다.
Source : https://freecontent.manning.com/the-computer-vision-pipeline-part-4-feature-extraction/
- feature engineering을 통해서 input data는 P(performance measure)를 높일 수 있는 좋은 수치 정보로 변환이 됩니다
- 이러한 수치정보(feature vector)를 만드는 방법을 feature extraction alforithm 이라고 합니다
- 대표적인 feature extraction alforithm에는 PCA(pricipal cimponent Analysis), AutoEncoder 등이 있습니다.
- 이미지, 텍스트 같은 특정 도메인에 있는 데이터는 해당 도메인의 특성에 맞게 feature extraction 방법들이 발전되어 왔습니다.
- 최근에는 Deep Learning을 사용하여 새롭게 feature를 생성하는 임베딩(Embedding) 방식을 사용합니다
반응형
'Machine_Learning > 이론' 카테고리의 다른 글
머신러닝 기초 개념-07. evaluation metric (0) | 2022.10.28 |
---|---|
머신러닝 기초 개념-06. loss function (0) | 2022.10.28 |
머신러닝 기초 개념-04. inference (0) | 2022.10.26 |
머신러닝 기초 개념-03. training (0) | 2022.10.26 |
머신러닝 기초 개념-02. Data Split (0) | 2022.10.26 |