1.(회귀분석) 가장 기본적인 머신러닝은 회귀분석이다.
2.(규제된 회귀분석) 회귀분석에서 흔히 발생하는 과최적화를 방지하기 위한 기법. 가중치 파라미터를 계산하는 과정에서 규제(L1,L2)를 도입하는 방식에 따라 라쏘, 리지 같은 방법들이 발전한다.
3.(SVM) 더 복잡하고 다차원적인 회귀분석을 위해, 초평면(다차원이란 얘기)상에서, 커널(내적연산, 단순화/계산효율성) 등을 통해, 각각의 차원별로 선긋기를 하는 방식. 선긋기는 비슷한 것과 아닌 것 사이의 경계를 나타내기 위한 선이고, 새로운 데이터가 들어왔을 때 기존에 만들어놓은 다차원의 선들로 예측값을 만들어 낼 수 있다. 딥러닝 이전까지 가장 널리 쓰이던 모델 중 하나가 SVM이다. 하지만 SVM은 커널연산을 위해 data scaling이 필요하며, 데이터의 수가 100,000 이상에서는 속도, 메모리 관점에서 비효율적인 것으로 알려져 있다.
4.(랜덤포레스트) 결정트리로 무수한 예스 or 노를 반복하는 방식이 존재하였으나, 과최적화의 문제가 심각하였다. 이를 극복하기 위해 결정변수를 임의로 선택하여(그래서 랜덤), 여러개의 결정트리모형을 만들고 이들의 평균치를 사용하여 예측값을 만들어내는 모형. 실무적으로 많이 쓰인다. 결정트리 방식은 SVM처럼 scaling에 신경쓸 필요가 없고 빠르다는 점에서 더 많이 쓰이고 있다.
https://devkor.tistory.com/entry/Supervised-Learning-Models
Supervised Learning Models
머신러닝에는 3종류의 방법이 있습니다. Supervised Learning Unsupervised Learning Reinforcement Learning 지도학습(Supervised Learning)은 인풋데이터와 아웃풋데이터가 정해져 있고 이를 토대로 학습하여 인풋데이
devkor.tistory.com
'AI > model' 카테고리의 다른 글
비지도 학습 - PCA(주성분분석) (0) | 2024.04.27 |
---|---|
결정트리 모델의 extrapolation 문제 (0) | 2024.04.22 |
나이브 베이즈 분류기(naive bayes classifier) (0) | 2024.04.21 |
라쏘(L1규제)와 리지(L2규제) (0) | 2024.04.20 |
강화학습 스터디 (0) | 2023.10.03 |