목록지도학습 (2)
JY Tech

인공지능의 성능을 끌어올리기 위해 시도 해 볼만한 것 중 Ensemble 기법이 있다. Ensemble는 여러가지 모델을 합쳐서 사용하는 것인데 그 중 voting에 대해 알아보자 Voting은 쉽게 말해 다수결의 원칙을 따르는 것이다. 여러가지 학습기가 학습을 하고 결과를 도출하면 그 결과물들 중에서 최종 선택을 하는 것이다 보팅은 하드보팅(hard vote)과 소프트보팅 (soft vote)2가지로 나뉘는데 사실 하드보팅이 앞서말한 다수결의 원칙과 제일 유사하다. 하드보팅은 분류기가 예측한 값들 중 가장 많이 예측한 값으로 최종결정을 내린다 예를들어 특정문제에 대해 a 모델은 1, b 모델은 0, c 모델은 1로 예측을 했다면 최종 예측은 1이 되는 것이다 소프트보팅은 확률의 평균을 구하고 확률이 높..

LG Aimers 2기 Phase2 과제 진행 중 기본모델인 Randomforest를 xgboost로 바꾸려고 했다. xgb = MultiOutputRegressor(xgb.XGBRegressor(파라미터 입력) ).fit(train_x, train_y) 위와 같이 모델을 설정하고 피팅을 했는데.. 아래와 같이 y must have at least two dimensions for multi-output regression but has only one. 이런 오류가 발생한다.. 해결방법은 의외로 간단하다 y는 최소 2차원이어야 하는데 1차원인 데이터를 가지고 실행해서 발생한 오류이다 y.reshape(-1, 1) 을 추가하여 차원을 늘려주면 해결된다 참고로 pandas series는 reshape를 지..