강의노트/Coursera

[Coursera] 머신러닝 Andrew Ng 강의 4주차 정리노트 - 1

잘하다연 2021. 2. 23. 11:13

Machine Learning by professor Andrew Ng in Coursera

Day 9 - Model Representation I 

 

뉴런 네트워크를 구성하는 요소는 크게 2가지 activation과 weight로 구성되어져있다. 

안에서 이루어지는 계산 과정은 x값들이 주어지면 a의 갯수에 맞게 theta의 차원이 정해진다. 그리고 h라는 함수에 넣어 최종적으로 하나의 activation node를 구하기 위해서 계산한다. 

우선 x1,x2,x3와 a1,a2,a3가 있으므로 x행렬 X theta행렬 = 3X1이 되어야한다.  

고로 theta는 3 X 4이고 (activation node 개수 X (x개수 + 1 ) )가 된다. 

 

Model Representation II

 

뉴런 네트워크가 계속해서 진행하면서 계산과정은 다음과 같다. 

 

 

activation 값을 a1, a2, a3를 구하고 난뒤에 h의 함수로 넣어줘 최종적으로 나오는 값을 구한다. 그 과정에서 로지스틱 회귀 g함수에 들어가기전 theta와 x의 곱들을 간단히 식으로 정리하면 위의 z와 같다. 

계속 다음 단계로 진행하기위해서 activation 값을 구하고 그 값을 이용해서 또 z값을 구해서 g함수에 넣어 a(j+1)값을 또 구하는 방식이다. 이 전의 x라는 먹이들을 통해서 a 값을 weight값을 구하며 계속해서 갱신하는 작업과 비슷한 것 같다.