말랑말랑제리스타일

[Pandas] null인 값 확인 및 채워넣기 본문

프로그래밍/파이썬

[Pandas] null인 값 확인 및 채워넣기

제리제리 2022. 1. 21. 07:21

DataFrame의 모든 값이 꼭 채워져있으리란 법은 없습니다.

이번 장에서는 DataFrame의 null인 값을 확인하는 방법과 null인 값을 다른 값으로 채워넣는 방법을 알아봅시다.

import pandas as pd
test_df = pd.read_csv("/content/test.csv")

test_df[test_df.Age.isnull()] #1.null인 값 확인
test_df.Age = test_df.Age.fillna(test_df.Age.mean()) #2.null인 값 채우기
test_df.Embarked = test_df.Embarked.replace('C','1').replace('Q','2').replace('S','3') #3.값대체

1. null인 값 확인

DataFrame의 해당 컬럼에서 null인 값, 즉 Age가 비어있는 항목을 전부 조회할 때 사용 가능한 함수가 isnull()이라는 함수입니다.

Age가 null인 값들을 새로운 DataFrame으로 만들어줄 수 있습니다.

2. null인 값 채우기

null 인 값을 isnull() 함수로 확인해보고 null인 값이 존재할 시 fillna() 함수로 채우기가 가능합니다.

여기서 매개변수로는 채워줄 값이 됩니다.

3. 값 대체

null과 언뜻 관련없어보이지만 간혹 데이터에 unknown이라던지 null에 가까운 값이 있기도 합니다.

이런 경우 replace로 값을 대체해줄 수 있습니다. replace(바꿀 문자, 바뀔문자) 로 Pandas의 DataFrame에서 사용 가능한 함수입니다.

Comments