티스토리 뷰
value_counts
어떤 값들이 있는지 대략적으로 보기. 종류와 개수를 새어준다.
stud_alcoh1['Pstatus'].value_counts()
s.str.contains(' string ')
series 데이터에 .str 을 붙여 text data 를 변형할 수 있다.
stud_alcoh1.famsize.str.contains('G')
isin
포함 한다면 True, 포함하지 않는다면 False
mother_job = stud_alcoh1.loc[stud_alcoh1.Mjob.isin(['at_home', 'services']), ['Mjob','Fjob', 'reason']]
df.agg
numpy.ptp 편차 구하기
chipo.groupby('order_id')['item_price'].agg(np.ptp)
pandas groupby
chipo.groupby('order_id')['item_price'].sum()
df join 하기
chipo = pd.merge(chipo, df, on='order_id', how='outer')
transform - agg 와 같은 역할이지만 dataframe 에서 작동
chipo.groupby('order_id')['item_price'].transform(np.ptp)
'Data Science' 카테고리의 다른 글
[Python] Logistic Regression (0) | 2018.06.08 |
---|---|
[Python] T-Test and P-Value (0) | 2018.06.08 |
one-hot-encoding (0) | 2018.05.12 |
[Python] Pandas module (0) | 2018.03.26 |