지도학습 supervised learning
데이터와 정답 = 입력input 과 타깃target
→ 훈련 데이터 training data
비지도 학습 unsupervised learning
테스트 세트 test set : 평가에 사용하는 테스트
훈련 세트 train set : 훈련에 사용되는 데이터
샘플 sample : 하나의 데이터
<aside>
슬라이싱을 사용할 때는 마지막 인덱스의 원소는 포함되지 않는다
</aside>
샘플링 편향 sampling bias : 일반적으로 훈련 세트와 테스트 세트에 샘플이 골고루 섞여 있지 않으면 샘플링이 한쪽으로 치우쳤다는 의미
넘파이 numpy : 파이썬의 대표적인 배열 라이브러리
seed()
: 난수를 생성하기 위한 정수 초깃값을 지정.arange()
: 함수에 정수 N을 전달하면 0에서부터 N-1까지 1씩 증가하는 배열을 만든다.shuffle()
: 주어진 배열을 랜덤하게 섞는다.훈련 세틍와 테스트 세트로 k-최근접 이웃 모델 훈련