티스토리 뷰
one-hot-encoding
몇 가지로 분류할 수 있는 데이터를 범주형 변수라고 한다.
one hot encoding 범주를 column 으로 만들고, 각각해당하는 칸의 정보를 1로 표시하고 나머지를 0으로 표시하는 방법이다.
소스코드
df_one_hot_encoded = pd.get_dummies(titanic.embarked)
titanic = pd.concat([titanic, df_one_hot_encoded], axis=1)
결과물
get_dummies 로 one hot encoding 을 만들어줌
Titanic 에 추가
pandas - get_dummies
Convert categorical variable into dummy/indicator variables
pandas - concat
concatenate pandas objects along a particular axis with optional set logic along the other axes.
Can also add a layer of hierarchical indexing on the concatenation axis, which may be useful if the labels are the same (or overlapping) on the passed axis number.
'Data Science' 카테고리의 다른 글
[Python] Logistic Regression (0) | 2018.06.08 |
---|---|
[Python] T-Test and P-Value (0) | 2018.06.08 |
pandas/numpy (0) | 2018.04.14 |
[Python] Pandas module (0) | 2018.03.26 |