목록Programming (97)
59doit
import numpy as np import pandas as pd PREVIOUS_MAX_ROWS = pd.options.display.max_rows pd.options.display.max_rows = 20 np.random.seed(12345) import matplotlib.pyplot as plt plt.rc('figure', figsize=(10, 6)) np.set_printoptions(precision=4, suppress=True) pd.options.display.max_rows = PREVIOUS_MAX_ROWS 결측치, 중복데이터 문자열 처리 , 분석적 데이터 변환에 대한 도구 설명 ▷ nan == non == null string_data = pd.Series(['aardva..
csv 파일을 불러오는 경우 import csv pandas_read_table() 함수를 이용하여 대부분의 파일 형식을 불러 올 수 있다. ▷ 변수 reader에 담기 f = open('pandas_dataset2/ex7.csv') reader = csv.reader(f) f # # ▷ 큰 따옴표가 제거된 튜플 for line in reader: print(line) # # ['a', 'b', 'c'] # ['1', '2', '3'] # ['1', '2', '3'] ▷ with ; 실행문이 다 돌아가면 자동으로 닫기 with open('pandas_dataset2/ex7.csv') as f: lines = list(csv.reader(f)) # lines 에 리스트로 요소별로 담기 # 원하는 형태 저장..
import pandas as pd import numpy as np df = pd.read_csv('pandas_dataset2/ex1.csv') df # # a b c d message # 0 1 2 3 4 hello # 1 5 6 7 8 world # 2 9 10 11 12 foo ▷ 구분자 => , pd.read_table('pandas_dataset2/ex1.csv', sep=',') # # a b c d message # 0 1 2 3 4 hello # 1 5 6 7 8 world # 2 9 10 11 12 foo ▷ type examples/ex2.csv pd.read_csv('pandas_dataset2/ex2.csv', header=None) # # 0 1 2 3 4 # 0 1 2 3 4..
df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]], index=['a', 'b', 'c', 'd'], columns=['one', 'two']) df # # one two # a 1.40 NaN # b 7.10 -4.5 # c NaN NaN # d 0.75 -1.3 ▷ SUM df.sum() # # one 9.25 # two -5.80 # dtype: float64 df.sum(axis='columns') # # a 1.40 # b 2.60 # c 0.00 # d -0.55 # dtype: float64 ▷ MEAN df.mean(axis='columns',skipna=False) # # a NaN # b 1.30..