미래를 예측하는 데이터분석가

[Coursera] 머신러닝 Andrew Ng 강의 2주차 정리노트 - 2 본문

강의노트/Coursera

[Coursera] 머신러닝 Andrew Ng 강의 2주차 정리노트 - 2

잘하다연 2021. 2. 8. 11:35

Machine Learning by professor Andrew Ng in Coursera

Day 5 - Computing Parameters Analytically

Normal Equation 

 

정규방정식을 이용할 때 파라미터값을 구해주는 식은 위와 같다.  

우선 정규방정식을 이용하면 스케일링을 해주지 않아도 된다는 점이 있고 위와 같이 특징들이 존재한다.   

 

그레디언트의 경우 learning_rate를 설정해야하고 반복을 계속해서 진행하지만 정규방정식의 경우 그럴 필요가 없다. 

그리고 속도면에서 feature수가 급격히 늘어날 수록 정규방정식의 속도가 느리기 때문에 그레디언트로 구하는 것이 낫다. 이런 점들을 잘 고려해 알고리즘을 설정하는 것이 중요하다고 생각한다. 

 

Normal Equation Noninvertibility

 

정규방정식을 이용해 파라미터값을 구하기위해서는 X와 X의 역행렬을 곱해야하는데 X의 역행렬이 존재하지 않을 때는 어떻게 계산할 수 있느냐에 대한 질문을 바탕으로 설명해주셨다. 

 

우선 feature들 중에서 서로 종속되어있는 경우와 너무 많은 feature들 (m<=n) 즉, data값보다 변수가 많은 경우에 일어난다.   

그로인한 해결책이라면 feature중 필요없는 것들을 제거하거나 정규화를 시켜주는 것이 있다.