티스토리 뷰

면접

Model

데이터조이 2022. 6. 26. 11:26

feature selcetion

Variance Threshold: 입력 feature 가 상수임을 판단하는 기법이다. 출력의 변화와 비교하여 거의 변화하지 않는 입력 변수는 출력을 예측하는 입력 변수 군에서 제외.

F-regression: 입력 변수와 출력 변수간의 correlation 기반의 regression 을 수행한 후, F-test 를 통해 입력 변수의 중요도를 판단하는 기법이다. 정규화를 위해 p-value 로 변환하고, 이를 통해 각 입력 변수들과 출력 변수의 상관도를 분석한다. (F-test: 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별. )

Mutual Information regression: 상호 정보.

Random Forest: 중요한 변수. 

Correlation priority: 상관 관계. 

 

Model

LSTM - keras

sequence length, drop out

정규화: batch norm

Activation function: ReLU,

 

Xgboost

 

Ensemble

 - voting 

 - bagging

 - boosting 

 - stacking: 여러개의 개별 모델들이 예측 값 뽑아냄 -> 이 예측 값을 input 으로 넣는 하나의 모델. 

 

 

F1 score

Precision:

Recall:

'면접' 카테고리의 다른 글

feature selection  (0) 2022.08.04
SQL  (0) 2022.06.26
Model selection  (0) 2022.06.25
sklearn - K-NN, Linear, SVM  (0) 2022.06.25
데이터분석전공  (0) 2016.10.24
댓글
Total
Today
Yesterday
공지사항
최근에 올라온 글
글 보관함