59doit

[Python-Pandas] 수학메서드 본문

Programming/Python(파이썬)

[Python-Pandas] 수학메서드

yul_S2 2022. 11. 9. 09:32
반응형
df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],
                   [np.nan, np.nan], [0.75, -1.3]],
                  index=['a', 'b', 'c', 'd'],
                  columns=['one', 'two'])
df
# <출력> 
#     one  two
# a  1.40  NaN
# b  7.10 -4.5
# c   NaN  NaN
# d  0.75 -1.3

 

 

 

 

SUM

df.sum()
# <출력> 
# one    9.25
# two   -5.80
# dtype: float64

df.sum(axis='columns')
# <출력> 
# a    1.40
# b    2.60
# c    0.00
# d   -0.55
# dtype: float64

 

MEAN

df.mean(axis='columns',skipna=False)
# <출력>
# a      NaN
# b    1.300
# c      NaN
# d   -0.275
# dtype: float64

 

 

skipna ; 누락된 값을 제외할 것인지 정하는 옵션, default 는 True

 

argmin, argmax  /  idxmin, idxmax

argmin, argmax 최소값, 최대값을 가지는 색인의 위치(정수)
idxmin, idxmax 최소값, 최대값을 가지는 색인의 값

df.idxmin()
# <출력>
# one    d
# two    b
# dtype: object

df.idxmax()
# <출력>
# one    b
# two    d
# dtype: object

 

 

describe 요약통계

; 여러개의 통계 결과 반환

df.describe()
# <출력>
#             one       two
# count  3.000000  2.000000
# mean   3.083333 -2.900000
# std    3.493685  2.262742
# min    0.750000 -4.500000
# 25%    1.075000 -3.700000
# 50%    1.400000 -2.900000
# 75%    4.250000 -2.100000
# max    7.100000 -1.300000

 

수치 데이터가 아닐경우는 다른 요약 통계 생성

obj = pd.Series(['a', 'a', 'b', 'c'] * 4)
obj.describe()
# <출력>
# count     16
# unique     3
# top        a
# freq       8
# dtype: object

 

반응형

'Programming > Python(파이썬)' 카테고리의 다른 글

[Python-Pandas] csv 파일 불러오기  (0) 2022.11.09
[Python-Pandas] 파일경로설정  (0) 2022.11.09
[Pandas] 넘파이에 의한 랜덤난수  (0) 2022.11.08
[Python] indexing  (0) 2022.11.08
[Pandas] arr  (0) 2022.11.08
Comments