티스토리 뷰

Data Science

pandas/numpy

noonsong 2018. 4. 14. 08:41

value_counts

어떤 값들이 있는지 대략적으로 보기. 종류와 개수를 새어준다. 

stud_alcoh1['Pstatus'].value_counts()


s.str.contains(' string ')

series 데이터에 .str 을 붙여 text data 를 변형할 수 있다. 

stud_alcoh1.famsize.str.contains('G') 


isin

포함 한다면 True, 포함하지 않는다면 False 

mother_job = stud_alcoh1.loc[stud_alcoh1.Mjob.isin(['at_home', 'services']), ['Mjob','Fjob', 'reason']]


df.agg

numpy.ptp 편차 구하기 

chipo.groupby('order_id')['item_price'].agg(np.ptp)


pandas groupby

chipo.groupby('order_id')['item_price'].sum()

df  join 하기 
chipo = pd.merge(chipo, df, on='order_id', how='outer')

transform - agg 와 같은 역할이지만 dataframe 에서 작동 
chipo.groupby('order_id')['item_price'].transform(np.ptp)


'Data Science' 카테고리의 다른 글

[Python] Logistic Regression  (0) 2018.06.08
[Python] T-Test and P-Value  (0) 2018.06.08
one-hot-encoding  (0) 2018.05.12
[Python] Pandas module  (0) 2018.03.26
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/03   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
글 보관함