일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 경제공부
- 머신러닝
- Algorithm
- 파이썬
- DATE_FORMAT
- PYTHON
- POP
- Andrew NG
- 코세라머신러닝강의
- map
- groupby
- sql
- 프로그래머스SQL
- 코세라
- 알고리즘
- SQL공부
- mysql
- orderby
- 프로그래머스
- 코세라머신러닝
- 안드류응
- coursera
- WHERE
- 머신러닝강의
- Machine Learning
- sql오답노트
- 코세라강의
- 인프런sql강의
- programmers
- sorted
- Today
- Total
목록머신러닝강의노트 (2)
미래를 예측하는 데이터분석가

Machine Learning by professor Andrew Ng in Coursera Day 9 - Model Representation I 뉴런 네트워크를 구성하는 요소는 크게 2가지 activation과 weight로 구성되어져있다. 안에서 이루어지는 계산 과정은 x값들이 주어지면 a의 갯수에 맞게 theta의 차원이 정해진다. 그리고 h라는 함수에 넣어 최종적으로 하나의 activation node를 구하기 위해서 계산한다. 우선 x1,x2,x3와 a1,a2,a3가 있으므로 x행렬 X theta행렬 = 3X1이 되어야한다. 고로 theta는 3 X 4이고 (activation node 개수 X (x개수 + 1 ) )가 된다. Model Representation II 뉴런 네트워크가 계속해서..

Machine Learning by professor Andrew Ng in Coursera Day 8 -The Problem of Overfitting 첫 번째 그림은 underfit or high bias된 경우이다. 모델이 데이터에 잘 적합하지 않으면 발생하는 문제이며 높은 편향이 발생하게 된다. 두 번째는 대체로 잘 적합해 좋은 모델이며 마지막으로 다항식이 매우 많은 모델은 과적합 즉 overfit or high variance를 일으킨다. 특히 과적합은 높은 분산을 가지게 되고 데이터는 적고 feature들이 많을 경우 많이 생긴다. 하지만 다른 데이터에 일반화시키지 못한다는 치명적인 단점이 존재해 과적합을 다루는 방법에 대해 소개한다. feature수를 줄이거나 정규화를 사용하는 방법이다. 정..