ParkS2.tistory

[머신러닝] Base Ensemble

2025. 7. 1. 19:14ㆍ카테고리 없음

기본 앙상블 기법들

1. 배깅(Bagging) - Bootstrap Aggregating

작동 원리:

원본 데이터에서 복원 추출로 여러 개의 부트스트랩 샘플 생성
각 샘플로 독립적인 모델 훈련
회귀: 평균, 분류: 다수결 투표로 최종 예측

장점:

과적합 방지 효과
모델의 분산(variance) 감소
병렬 처리 가능

대표 모델: Random Forest

2. 부스팅(Boosting)

작동 원리:

약한 학습기(weak learner)들을 순차적으로 훈련
이전 모델의 오류에 가중치를 두어 다음 모델이 집중하도록 함
최종적으로 가중 투표로 결합

장점:

편향(bias) 감소
높은 예측 성능
점진적 학습

대표 모델: AdaBoost, Gradient Boosting, XGBoost, LightGBM, CatBoost

3. 스태킹(Stacking)

작동 원리:

1단계: 여러 베이스 모델로 예측값 생성
2단계: 메타 모델이 베이스 모델들의 예측을 입력으로 받아 최종 예측

장점:

서로 다른 알고리즘의 장점 결합
높은 성능 가능

단점:

복잡한 구조
과적합 위험

4. 보팅(Voting)

하드 보팅(Hard Voting):

각 모델의 예측 클래스를 다수결로 결정

소프트 보팅(Soft Voting):

각 모델의 예측 확률을 평균내어 결정

티스토리툴바