본문 바로가기

Python_Wiki47

(비순서)자료형(data type) - 집합, 부울 집합(set) - 순서없고 중복없는 객체의 집합(집합관련 데이터처리)createset 키워드로 생성, 괄호 안에 리스트, 문자열 입력 / 예, set1 = set([1,2,3])순서를 사용하고 싶으면 리스트나 튜플로 변환하여 사용비순서 자료 형이므로 인덱싱, 슬라이싱 불가중복불가 => set2 = set("selena") => ['l', 's', 'n', 'e', 'a']set 1= {1,2,3,4,5} 처럼 생성하기도 함{} 안에는 리스트나 딕셔너리를 포함할수 없음. 연산자교집합,차집합,합집합: &, -, |대칭차집합: ^ (A | B - A&B)함수add(): 1개 값 추가set1 = set()set1.add("apple")set1.add("banana") => {'apple', 'banana.. 2025. 5. 27.
(순서)자료형(data type) - 리스트 리스트 (lists)가장 많이 사용리스트는 여러 자료를 모아서 사용할 수 있는 형태의 자료. 여러 요소를 하나의 변수로 사용하고 싶을 때 사용list: Create대괄호[ ] 자료를 쉼표로 구분함. 대괄호 안에 들어가는 것들은 요소라고 부른다 (영어로 element)list: update변수[인덱스] = "변경할 값"list: delete - del / remove / pop / cleardel 변수[인덱스]리스트 자료의 인덱싱과 슬라이싱인덱싱은 문자를 내부의 문자 하나를 선택하는 연산자슬라이싱은 문자열의 특정 범위를 선택한 연산자리스트 기호 [ ] 안에 숫자를 넣어서 인덱싱 혹은 슬라이싱을 하는데 그 안에 들어가는 숫자를 인덱스라고 부름리스트 연산자: +(덧셈), *(반복), len()(길이구하기)예,.. 2025. 5. 27.
(순서)자료형(data type) - 숫자 Numbers 순서자료형숫자 (number)- 소수점 없는 숫자(정수) + 소수점 있는 숫자(실수, 부동소수점)연산자:사칙연산: 덧뺄곱나눔 - + - * /몫, 나머지, 제곱: // % **연산자/함수연산: 사칙연산: 덧뺄곱나눔 - + - * /, 몫, 나머지, 제곱: // % **int(), float() --> 숫자나 문자열을 각각 정수형, 실수형으로 변환abs(), pow() --> 절대값 출력, 제곱출력round(숫자1, 숫자2) --> 숫자 1을 숫자2만큼의 자리수로 반올림. 예, round(1.33333,2) => 1.33숫자2에 음수를 사용하면 정수 자리수 반올림 2025. 5. 27.
Pandas EDA 기초 및 함수 #eda의 기본 과정(탐색적 데이터 분석) - 미국 통계학자가 제안한 방법론. 기존 통계학의 방법을 따르다가는 데이터 본래의 정보를 파악하기 어려우므로, 본연의 데이터 탐색에 집중하자는 방법론.#1. 데이터의 출처와 주제에 대해 이해#2. 데이터의 크기 확인#3. 데이터의 구성요소의 속성 확인import pandas as pddoc = pd.read_csv( "COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports/04-01-2020.csv", encoding='utf-8-sig')#reading excel using Pandaspd.read_excel('filename.xlsx') #reads data from the first she.. 2025. 5. 20.
Pandas - Series, Dataframe - CRUD / loc,iloc / data filtering pandas는 시리즈와 데이터 프레임이라는 구조화된 형식을 제공 1. Series시리즈는 데이터가 순차적으로 나열된 일차원 배열의 형태인덱스와 value가 일대일 대응 관계딕셔너리로 시리즈 생성. 키는 시리즈 인덱스와 대응하고 값은 시리즈의 데이터 값으로 변환됨import pandas as pd#series = 1st dimension data#createseriesdata=pd.Series([70,60,90])seriesdata = pd.Series([70,60,90], index = ['국어','영어','수학']) #인덱스는 지정하지않으면 0부터 자동생성. 지정된 경우 지정된 인덱스 사용. 행의 레이블을 뜻함#create using dict type. 키는 시리즈 인덱스와 대응하고 값은 시리즈의 데이.. 2025. 5. 20.