티스토리 뷰

Data Science

one-hot-encoding

noonsong 2018. 5. 12. 22:19

one-hot-encoding

몇 가지로 분류할 수 있는 데이터를 범주형 변수라고 한다. 
one hot encoding 범주를 column 으로 만들고, 각각해당하는 칸의 정보를 1로 표시하고 나머지를 0으로 표시하는 방법이다. 

소스코드 

df_one_hot_encoded = pd.get_dummies(titanic.embarked)

titanic = pd.concat([titanic, df_one_hot_encoded], axis=1)


결과물

get_dummies 로 one hot encoding 을 만들어줌 


Titanic 에 추가



pandas - get_dummies 

Convert categorical variable into dummy/indicator variables


pandas - concat

concatenate pandas objects along a particular axis with optional set logic along the other axes.


Can also add a layer of hierarchical indexing on the concatenation axis, which may be useful if the labels are the same (or overlapping) on the passed axis number.






'Data Science' 카테고리의 다른 글

[Python] Logistic Regression  (0) 2018.06.08
[Python] T-Test and P-Value  (0) 2018.06.08
pandas/numpy  (0) 2018.04.14
[Python] Pandas module  (0) 2018.03.26
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함