데이터를 잘 대변해주는 선 (최적선, line of best)을 찾아내는 것 즉, 데이터에 가장 잘 맞는 가설 함수를 찾아야
목표 변수(target variable / output variable) : 맞추려고 하는 값
입력 변수(input variable / feature) : 맞추는데 사용하는 값
가설 함수
가설 함수(hypothesis function) : 데이터를 잘 대변 해줄 수 있는 선(y=ax+b)을 찾는 것
가설 함수 표현법 : 일반적으로, $h(x)=\Theta _{0}+\Theta _{1}x$ 로 표현함
목표 변수 y에 끼치는 요소들이 굉장히 많기 때문에, 이러한 것들을 일관성 있게 표현하기 위해서 θ로 표현함
θ들을 조율하면서 최적의 선을 찾음
가설 함수 평가법 : 평균 제곱 오차(MSE)
이 데이터들이 가설 함수와 얼마나 떨어져있는지 평가하는 방법
각 데이터의 실제값과 가설 함수가 예측하는 값의 차이
모든 오차를 양수로 표현하기 위해서 제곱함
평균 제곱 오차(MSE) 일반식
$$\frac{1}{m}\sum_{i-1}^{m}(h_{\Theta }(x^{i})-y^{i})^{2}$$ $x^{i}$에 대한 예측값($h_{\Theta }(x^{i})$)과 실제 결과값($y^{i}$)에 대한 차이(=오차)의 제곱값을 모두 더한 후, 데이터의 개수(m)으로 나눈 것