티스토리 뷰
feature selcetion
Variance Threshold: 입력 feature 가 상수임을 판단하는 기법이다. 출력의 변화와 비교하여 거의 변화하지 않는 입력 변수는 출력을 예측하는 입력 변수 군에서 제외.
F-regression: 입력 변수와 출력 변수간의 correlation 기반의 regression 을 수행한 후, F-test 를 통해 입력 변수의 중요도를 판단하는 기법이다. 정규화를 위해 p-value 로 변환하고, 이를 통해 각 입력 변수들과 출력 변수의 상관도를 분석한다. (F-test: 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별. )
Mutual Information regression: 상호 정보.
Random Forest: 중요한 변수.
Correlation priority: 상관 관계.
Model
LSTM - keras
sequence length, drop out
정규화: batch norm
Activation function: ReLU,
Xgboost
Ensemble
- voting
- bagging
- boosting
- stacking: 여러개의 개별 모델들이 예측 값 뽑아냄 -> 이 예측 값을 input 으로 넣는 하나의 모델.
F1 score
Precision:
Recall:
'면접' 카테고리의 다른 글
feature selection (0) | 2022.08.04 |
---|---|
SQL (0) | 2022.06.26 |
Model selection (0) | 2022.06.25 |
sklearn - K-NN, Linear, SVM (0) | 2022.06.25 |
데이터분석전공 (0) | 2016.10.24 |
댓글
- Total
- Today
- Yesterday
공지사항
최근에 올라온 글
글 보관함