티스토리 뷰

머신러닝

5. 선형 회귀

0307kjb 2022. 4. 17. 10:58

문제, 기존 훈련보다 훨씬 큰 값을 예측하면 어떻게 될까..?

생선 50의 길이는 약 1500의 무게 값이 나간다고 한다.

 

여기서 50의 길이 데이터를 예측하면 무게는 어떻게 될까? [1033 ???]

그런데 조금 이상하다!?

 

 

길이를 50, 100을 넣든 항상 1033이고 길이가 커져도 변함 없는 무게를 나타내는 것을 볼 수 있다.

좌하단에서 우상단 그래프에 크게 어긋나니 모델을 수정 할 필요가 있다.

 

==>

 

선형회귀는 비교적 간단하고 성능이 뛰어나며 특성이 하나인 경우 어떤 직선을 학습하는 알고리즘이다.

 

 

전 보다 큰 무게 예측 값을 볼 수 있다. 그리고 선형 회귀에서 가중치와 절편을 구할 수 있으므로 최적의 직선도 구할 수 있다.

coef_, intercept_를 머신러닝 알고리즘이 찾은 값이라는 의미로 모델 파라미터라고 한다.

머신러닝 알고리즘의 훈련 과정은 최적의 모델 파타미터를 찾는 과정과 같은데, 이를 모델 기반 학습이라 한다.

앞서 사용한 이웃 알고리즘은 훈련 세트를 저장하는 것이 훈련의 전부인데 이를 사례 기반 학습이라 한다.

 

 

그런데 과소적합 문제와 그래프에서 길이의 양수 뿐만 아니라 길이의 음수 또한 예측 할 수 있다.

2차 함수라면? 어떤가!

 

무게 = a X 길이^2 + b x 길이 + c

 

a = 1.01... , b = -21.5, c = 116라는 이차 함수 그래프의 가중치와 절편을 학습했을 뿐만 아니라 예측 값도 실제 무게인 1500과 비슷한 1573을 얻었고 결정계수도 올라갔다.(그런데 과소적합 ㅠㅠ)

 

 

마지막으로 그래프를 살펴 보면 길이에 따른 무게의 그래프가 잘 형성되어 있다는 점을 확인 할 수 있다.

'머신러닝' 카테고리의 다른 글

7. 로지스틱 회귀  (0) 2022.04.18
6. 특성 공학과 규제 ( 회귀 )  (0) 2022.04.17
4. k - 최근접 이웃 회귀  (0) 2022.04.16
3. 데이터 전처리  (0) 2022.04.16
2. 훈련 세트/ 테스트 세트  (0) 2022.04.14
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함