pandas: 피벗테이블 만들기 .pivot_table /+) pivot
피벗테이블은 crosstab이랑은 다르게, 엑셀 피벗테이블처 값 영역에 변수를 별도로 넣어서 계산을 할 수 있음#index 행, columns 열, values 값에 넣을 열, aggfunc 집계함수pd.pivot_table(df, index='Sex', columns='Pclass', values='Survived', aggfunc='mean') #crosstab처럼 margins 가능pd.pivot_table(df, index='Sex', columns='Survived', values='Age', aggfunc='mean', margins=True)#aggfunction에 여러개pd.pivot_table(df, index='Sex', columns='Survived', values='Age', a..
2025. 7. 14.
pandas: crosstab / 범주형 데이터 비교 분석
pd.crosstab(index=행, columns=열, margins=True/False, normalize=True/False)margins: 행의 합이나 열의합을 구할건지 여부normalize: 비율을 구할건지 여부#pd.crosstab(행,열)pd.crosstab(df['Sex'], df['Survived'])#.normalize#normalize = 'all': 전체 합이 100%#normalize = 'index': 행별 합이 100%#normalize = 'columns': 열별 합이 100%pd.crosstab(df['Sex'], df['Survived'], normalize='all') pd.crosstab(df['Sex'], df['Survived'], normalize='all', ..
2025. 7. 14.
pandas - 데이터 결합: join(파이썬) / merge / concat
pd.merge(df1, df2, on=기준컬럼, how=결합방법)결합방법에는 'inner', 'left', 'right', 'outer'. 방식은 sql과 동일기준컬럼이 여럿이면 리스트로 on에 기준컬럼을 넣어주면 됨. #examplepd.merge(customer, orders, on='id', how='inner') 두 데이터의 기준 컬럼명이 다른 경우pd.merge(df1, df2, left_on=df1의 기준컬럼, right_on=df2의 기준컬럼, how=결합방법) 다중요건 merge값을 찾기 위한 열이 다중으로 필요할 경우df1.merge(df2, on=['업체','음료'], how='left') 병합 시, 값이 특정 범위안에 들어가는지 여부에 따라 병합할 경우(merge_asof)⭐ df1..
2025. 7. 14.