회귀 regression : 임의의 어떤 숫자를 예측하는 문제
이웃한 샘플의 타깃은 어떤 클래스가 아니라 임의의 수치
reshpe()
: 넘파이 배열에서 크기를 바꿀 수 있는 메서드. 바꾸려는 배열의 크기를 지정.
KNeighborsRegressor
: 사이킷런에서 k-최근접 이웃 회귀 알고리즘을 구현한 클래스
결정계수 coefficient of determination, $R^2$
$$ R^2 = 1 - \frac{(타깃 - 예측)^2의 \ 합}{(타깃 - 평균)^2의 \ 합} $$
mean_absolute_error
: 타깃과 예측의 절댓값 오차를 평균하여 반환
훈련 세트와 테스트 세트의 점수를 비교했을 때
훈련 세트가 너무 높으면 과대적합 overfitting, 그 반대이거나 두 점수가 모두 낮으면 과소적합 underfitting
k-최근접 이웃 알고리즘으로 모델을 더 복잡하게 만드는 방법 - 이웃의 개수 k를 줄이는 것
k-최근접 이웃 회귀 모델은 분류와 동일하게 가장 먼저 가까운 k개의 이웃을 찾음 → 이웃 샘플의 타깃값을 편균하여 이 샘플의 예측값으로 사용