본문 바로가기

Python_Wiki/Python_Syntax20

in, not in text = "Hello, Python"print("Python" in text) => Trueprint("Java" not in text) => True 주식회사만 뽑아내기data = "(주)회사이름, 주식회사 회사이름"print("(주)" in data or "주식회사" in data) => true 2025. 7. 8.
문자열: 제일 왼쪽 빈칸 하나 없애기(.lstrip()) .lstrip()pandas Series를 다룰때는 .str.lstrip()e.g.df['column_name'] = pd.to_datetime(df['column_name'].str.lstrip()) 2025. 6. 5.
결측치 제거, 개수 확인 결측치 관리결측치 처리방법: 결측치의 유형 및 비율에 따라 적절한 결측치 처리 방법을 결정해야함제거: 결측치가 발생한 행, 열을 삭제. 가장 쉽고 단순한 방식.- 결측치를 제거하면 결측치가 없는 완벽한 데이터셋을 만들 수 있지만, 결측치가 포함된 데이터가 모두 삭제되어 데이터 크기에 손실이 발생- 경우에 따라 결측치를 무시하고 관측치만으로 분석을 시행할 경우, 통계적 편향이 생길 가능성이 생김치환: 결측치를 적당한 방법으로 대체하는 것- 데이터의 특성에 맞게 적당한 평균, 중앙값, 최빈값으로 대체 가능하나, 평균값 등으로 단순 대체하는 방법은 자료의 편향성을 높이고, 특성들 간의 상관 관계를 왜곡할 수 있음- 데이터에 대한 도메인 지식이 있어야 효율적으로, 정확히 결측치 대체 가능모델기반처리: 결측치를 .. 2025. 6. 5.
예외 처리 / try - except 오류구문 오류(syntax error): 프로그램 실행 전에 발생하는 오류. 문법적으로 문제가 발생한 부분을 수정해 줘야 함(띄어쓰기 오류 등)타입 오류(Type error): 잘못된 타입을 사용할 때 발생. 예, 숫자와 문자를 더하려고 할때 오류 발생이름 오류(name error): 정의되지 않는 변수를 참조할때 발생인덱스 오류(index error): 리스트나 튜플의 범위를 벗어난 인덱스에 접근하려고 할 때 발생모듈 오류(module not found error): 사용하려는 모듈이 설치되지 않았거나 잘못된 경로로 가져올 때 발생속성 에러(attribute error): 객체에 존재하지 않는 속성이나 메서드를 호출하려고 할 때 발생키 오류(key error): 딕셔너리에 존재하지 않는 키에 접근하려고.. 2025. 5. 29.
함수function, 매개변수 구조: 입력>함수>출력입력만 바뀌고 같은 코드가 반복되는 경우 특정 코드들을 모아두는 용도로 사용파이썬 내장함수: https://docs.python.org/3/library/functions.htmldef 함수이름(매개변수): 수행문1 수행문2 ... return 결과 #함수 호출, 인수=arguments함수이름(인수1,인수2) 매개변수 parameter#디폴트 매개 변수 => 값이 들어오지 않으면 디폴트 값으로 처리함def 함수이름(매개변수=디폴트값): 수행문1 ... return 결과 #가변매개변수 => 원하는 만큼의 인자를 받을 수 있는 함수 가변 매개 변수를 사용한다고 함def 함수이름(*매개변수): 수행문1 ... return 결과 #가변 매개.. 2025. 5. 28.
제어문: 반복문 반복문forwhilefor 반복문특정 코드로 반복 작업을 하고 싶을 때 사용리스트와 튜플 그리고 마지막 문자열의 1번째 요소~마지막 요소까지 차례로 변수에 대입되어 "반복수행문" 수행for 변수 in 리스트(or tuple, or strings): 반복수행문1 for 반복자 in 반복할 수 있는 것: 반복수행문1#기본구조for i in range(5): print("selena python programming") #문자열반복 myList = "Korea"for a in myList: print(a) #리스트반복: 요소 하나하나가 변수에 들어가서 반복myList = ["Korea", "USA", "Japan"]for a in myList: print(a)#딕셔너리반복: key가 변수.. 2025. 5. 28.