본문 바로가기

Python_Wiki47

matplotlib/seaborn: bar chart 막대 그래프 plt.barplt.figure(figsize=(10,5))plt.plot(x=df['col_name'], y=df['col_name2'])plt.xlabel('col_name')plt.ylabel('col_name2')plt.xticks([2005,2010,2015,2020])plt.ylim(7,10)plt.savefig('figname.png', dpi=600) sns.barplot(data=df, x='열이름', y='열이름')#exampledf = sns.load_dataset('penguins')plt.figure(figsize=(10,5))sns.barplot(data=df, x='species', y='body_mass_g', hue="sex")plt.title('body mass per s.. 2025. 6. 5.
문자열: 제일 왼쪽 빈칸 하나 없애기(.lstrip()) .lstrip()pandas Series를 다룰때는 .str.lstrip()e.g.df['column_name'] = pd.to_datetime(df['column_name'].str.lstrip()) 2025. 6. 5.
matplotlib: pie chart 파이차트 plt.pie()documentation: https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_features.htmlfive "generic font family names" (serif, monospace, fantasy, cursive, and sans-serif)reference: fontfamily documentation: https://matplotlib.org/stable/users/explain/text/fonts.htmlpie chart 속성 Pie charts — Matplotlib 3.10.3 documentationDemo of plotting a pie chart. Swap label and autopct text po.. 2025. 6. 5.
결측치 제거, 개수 확인 결측치 관리결측치 처리방법: 결측치의 유형 및 비율에 따라 적절한 결측치 처리 방법을 결정해야함제거: 결측치가 발생한 행, 열을 삭제. 가장 쉽고 단순한 방식.- 결측치를 제거하면 결측치가 없는 완벽한 데이터셋을 만들 수 있지만, 결측치가 포함된 데이터가 모두 삭제되어 데이터 크기에 손실이 발생- 경우에 따라 결측치를 무시하고 관측치만으로 분석을 시행할 경우, 통계적 편향이 생길 가능성이 생김치환: 결측치를 적당한 방법으로 대체하는 것- 데이터의 특성에 맞게 적당한 평균, 중앙값, 최빈값으로 대체 가능하나, 평균값 등으로 단순 대체하는 방법은 자료의 편향성을 높이고, 특성들 간의 상관 관계를 왜곡할 수 있음- 데이터에 대한 도메인 지식이 있어야 효율적으로, 정확히 결측치 대체 가능모델기반처리: 결측치를 .. 2025. 6. 5.
Pandas 판다스: 판다스 기초 설명, 파일 불러오기 데이터 분석 라이브러리행과 열로 이루어진 이 차원 데이터를 효율적으로 가공할 수 있는 다양한 기능을 제공설치 방법: pip install pandas사용방법: import pandas as pd웹사이트: pandas.pydata.org데이터Kaggle(캐글)에서 titanic데이터 사용(https://www.kaggle.com/c/titanic)데이터 분석 경진대회를 주최하는 플랫폼회사의 과제 연구 주요 서비스를 위해 분석에 필요한 데이터를 제공해서 주최대기업 경력직을 채용할 때 면접 문제로 사용됨문제의 목표: 타이타닉에서 살아남을 수 있는 승객을 예측하기 pandas 파일 불러오기다양한 외부 형태의 파일을 읽어와서 데이터 프레임으로 변환하는 함수를 제공file formatreaderwriterCSVre.. 2025. 5. 30.
예외 처리 / try - except 오류구문 오류(syntax error): 프로그램 실행 전에 발생하는 오류. 문법적으로 문제가 발생한 부분을 수정해 줘야 함(띄어쓰기 오류 등)타입 오류(Type error): 잘못된 타입을 사용할 때 발생. 예, 숫자와 문자를 더하려고 할때 오류 발생이름 오류(name error): 정의되지 않는 변수를 참조할때 발생인덱스 오류(index error): 리스트나 튜플의 범위를 벗어난 인덱스에 접근하려고 할 때 발생모듈 오류(module not found error): 사용하려는 모듈이 설치되지 않았거나 잘못된 경로로 가져올 때 발생속성 에러(attribute error): 객체에 존재하지 않는 속성이나 메서드를 호출하려고 할 때 발생키 오류(key error): 딕셔너리에 존재하지 않는 키에 접근하려고.. 2025. 5. 29.