목록Programming/Python(파이썬) (44)
59doit
import numpy as np import pandas as pd pd.options.display.max_rows = 20 np.random.seed(12345) import matplotlib.pyplot as plt plt.rc('figure', figsize=(10, 6)) np.set_printoptions(precision=4, suppress=True) data = pd.Series(np.random.randn(9), index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 3, 1, 2, 2, 3]]) data # # a 1 -0.204708 # 2 0.478943 # 3 -0.519439 # b 1 -0.555730 # 3..
import pandas as pd import numpy as np data = pd.Series([1., -999., 2., -999., -1000., 3.]) data # # 0 1.0 # 1 -999.0 # 2 2.0 # 3 -999.0 # 4 -1000.0 # 5 3.0 # dtype: float64 ▷ 여러개를 한번에 치환 data.replace(-999, np.nan) # # 0 1.0 # 1 NaN # 2 2.0 # 3 NaN # 4 -1000.0 # 5 3.0 # dtype: float64 data.replace([-999, -1000], np.nan) # # 0 1.0 # 1 NaN # 2 2.0 # 3 NaN # 4 NaN # 5 3.0 # dtype: float64 ▷ 대응관계 di..
import numpy as np import pandas as pd PREVIOUS_MAX_ROWS = pd.options.display.max_rows pd.options.display.max_rows = 20 np.random.seed(12345) import matplotlib.pyplot as plt plt.rc('figure', figsize=(10, 6)) np.set_printoptions(precision=4, suppress=True) pd.options.display.max_rows = PREVIOUS_MAX_ROWS 결측치, 중복데이터 문자열 처리 , 분석적 데이터 변환에 대한 도구 설명 ▷ nan == non == null string_data = pd.Series(['aardva..
csv 파일을 불러오는 경우 import csv pandas_read_table() 함수를 이용하여 대부분의 파일 형식을 불러 올 수 있다. ▷ 변수 reader에 담기 f = open('pandas_dataset2/ex7.csv') reader = csv.reader(f) f # # ▷ 큰 따옴표가 제거된 튜플 for line in reader: print(line) # # ['a', 'b', 'c'] # ['1', '2', '3'] # ['1', '2', '3'] ▷ with ; 실행문이 다 돌아가면 자동으로 닫기 with open('pandas_dataset2/ex7.csv') as f: lines = list(csv.reader(f)) # lines 에 리스트로 요소별로 담기 # 원하는 형태 저장..