본문 바로가기

Python_Wiki47

pandas: 피벗테이블 만들기 .pivot_table /+) pivot 피벗테이블은 crosstab이랑은 다르게, 엑셀 피벗테이블처 값 영역에 변수를 별도로 넣어서 계산을 할 수 있음#index 행, columns 열, values 값에 넣을 열, aggfunc 집계함수pd.pivot_table(df, index='Sex', columns='Pclass', values='Survived', aggfunc='mean') #crosstab처럼 margins 가능pd.pivot_table(df, index='Sex', columns='Survived', values='Age', aggfunc='mean', margins=True)#aggfunction에 여러개pd.pivot_table(df, index='Sex', columns='Survived', values='Age', a.. 2025. 7. 14.
pandas: crosstab / 범주형 데이터 비교 분석 pd.crosstab(index=행, columns=열, margins=True/False, normalize=True/False)margins: 행의 합이나 열의합을 구할건지 여부normalize: 비율을 구할건지 여부#pd.crosstab(행,열)pd.crosstab(df['Sex'], df['Survived'])#.normalize#normalize = 'all': 전체 합이 100%#normalize = 'index': 행별 합이 100%#normalize = 'columns': 열별 합이 100%pd.crosstab(df['Sex'], df['Survived'], normalize='all') pd.crosstab(df['Sex'], df['Survived'], normalize='all', .. 2025. 7. 14.
pandas - 데이터 결합: join(파이썬) / merge / concat pd.merge(df1, df2, on=기준컬럼, how=결합방법)결합방법에는 'inner', 'left', 'right', 'outer'. 방식은 sql과 동일기준컬럼이 여럿이면 리스트로 on에 기준컬럼을 넣어주면 됨. #examplepd.merge(customer, orders, on='id', how='inner') 두 데이터의 기준 컬럼명이 다른 경우pd.merge(df1, df2, left_on=df1의 기준컬럼, right_on=df2의 기준컬럼, how=결합방법) 다중요건 merge값을 찾기 위한 열이 다중으로 필요할 경우df1.merge(df2, on=['업체','음료'], how='left') 병합 시, 값이 특정 범위안에 들어가는지 여부에 따라 병합할 경우(merge_asof)⭐ df1.. 2025. 7. 14.
Pandas 고급함수: apply, map 1. apply: 사용자 정의 함수를 데이터에 적용하고 싶을 때 사용.apply(커스텀 함수 이름, axis=0 or 1)#example1def pclass_sibsp(x): if x['Pclass'] == 1 and x['SibSp'] == 1: return 1 else: return 0 df1['pclass_sibsp_filter'] = df1.apply(pclass_sibsp, axis=1) #함수에서 열을 참조했기때문에 axis=1을 꼭 써줘야함#lambda사용df1['pclass_sibsp_lambda'] = df1.apply(lambda x: 1 if x['Pclass'] == 1 and x['SibSp'] == 1 else 0, axis=1)#.. 2025. 7. 14.
pandas 판다스: 날짜 다루기 1. 문자형을 날짜형으로 변경: pd.to_datetime(컬럼, format='날짜 형식')#examplespd.to_datetime(df['Date'], format='%Y-%m-%d') df['Date1'] = pd.to_datetime(df['Date'], format='%Y-%m-%d') #새로운 컬럼에 변환한 값 넣기df=pd.read_csv('url',parse_dates=['col_name']) #불러올때 'col_name'의 자료형을 바로 datetime으로 변경해서 호출하기 날짜 형식 코드의미예시%Y연도 (4자리)2025%y연도 (2자리)25%m월 (2자리)07%B월 이름 (영문, 전체)July%b월 이름 (영문, 축약)Jul%d일 (2자리)11%A요일 이름 (영문, 전체)Friday%.. 2025. 7. 11.
list / dict comprehension (for문) 이건 혁신이야...!!!!!! 파이썬 배우다 간만에 도파민 대폭발😍 list comprehension: 리스트 안에 for문을 포함하여 한 줄로 편하게 코드를 작성할 수 있게 하는 문법.#[표현식 for 항목 in 반복가능객체 if 조건문]#1ls = []for i in range(1, 5): ls.append(i)print(ls)#1-1ls = [i for i in range(1,5)]print(ls)#2ls = []for i in range(1, 5): if i % 2 == 0: ls.append(i * 4)print(ls)#2-1ls = [i * 4 for i in range(1,5) if i % 2 == 0]print(ls)#for문 중첩#3gugudan = []for i.. 2025. 7. 11.