[Python] pandas의 get_dummies을 이용한 원핫인코딩
·
카테고리 없음
One-Hot Encoding? (원핫인코딩)범주형 피처의 각 범주에 대해 별도의 열을 만들고 더미변수로 변환하는 기법원핫인코딩을 하는 이유?--> Label Encoding에서 일어나는 가중치 문제가 발생하지 않기 때문원핫인코딩 실습아래와 같은 데이터프레임이 있다. import pandas as pd import numpy as npdf = pd.DataFrame({'species' : ['dog', 'cat', 'pig'], 'color' : ['brown', 'black', 'pink'], 'count' : [3,6,81]})df'species' 피처와 'color' 피처는 범주형 데이터이므로, 수치화를 해주어야 하고 이때 원핫인코딩을 이용해보자.판다스의 get_dummies를 이용하면 특정 피처에..
Gabbyit
'범주형데이터수치화' 태그의 글 목록