59doit
[Python-Pandas] 수학메서드 본문
반응형
df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],
[np.nan, np.nan], [0.75, -1.3]],
index=['a', 'b', 'c', 'd'],
columns=['one', 'two'])
df
# <출력>
# one two
# a 1.40 NaN
# b 7.10 -4.5
# c NaN NaN
# d 0.75 -1.3
▷
SUM
df.sum()
# <출력>
# one 9.25
# two -5.80
# dtype: float64
df.sum(axis='columns')
# <출력>
# a 1.40
# b 2.60
# c 0.00
# d -0.55
# dtype: float64
▷
MEAN
df.mean(axis='columns',skipna=False)
# <출력>
# a NaN
# b 1.300
# c NaN
# d -0.275
# dtype: float64
skipna ; 누락된 값을 제외할 것인지 정하는 옵션, default 는 True
argmin, argmax / idxmin, idxmax
argmin, argmax 최소값, 최대값을 가지는 색인의 위치(정수)
idxmin, idxmax 최소값, 최대값을 가지는 색인의 값
df.idxmin()
# <출력>
# one d
# two b
# dtype: object
df.idxmax()
# <출력>
# one b
# two d
# dtype: object
describe 요약통계
; 여러개의 통계 결과 반환
df.describe()
# <출력>
# one two
# count 3.000000 2.000000
# mean 3.083333 -2.900000
# std 3.493685 2.262742
# min 0.750000 -4.500000
# 25% 1.075000 -3.700000
# 50% 1.400000 -2.900000
# 75% 4.250000 -2.100000
# max 7.100000 -1.300000
▷
수치 데이터가 아닐경우는 다른 요약 통계 생성
obj = pd.Series(['a', 'a', 'b', 'c'] * 4)
obj.describe()
# <출력>
# count 16
# unique 3
# top a
# freq 8
# dtype: object
반응형
'Programming > Python(파이썬)' 카테고리의 다른 글
[Python-Pandas] csv 파일 불러오기 (0) | 2022.11.09 |
---|---|
[Python-Pandas] 파일경로설정 (0) | 2022.11.09 |
[Pandas] 넘파이에 의한 랜덤난수 (0) | 2022.11.08 |
[Python] indexing (0) | 2022.11.08 |
[Pandas] arr (0) | 2022.11.08 |
Comments