AI/preprocessing
one hot encoding의 이점
bitpoint
2024. 5. 6. 10:52
one hot encoding은 범주형 변수를 0,1,2,3 이런식으로 변환할때 생길 수 있는 관계성을 없애 줄 수 있는 장점이 있다. pandas를 기준으로는 dummies()라는 함수를 지원한다(대부분의 머신러닝 라이브러리들이 비슷한 기능을 제공한다). 하지만 dummies()는 컴파일해서 사용하는 방식이 아니므로, train set과 test set의 열이 다를 가능성이 생기며, 사용해야 한다면 train, test를 합친 상태에서 수행해야 한다.
http://Colab.research.google.com/?hl=ko
Google Colab
colab.research.google.com