Notice
Recent Posts
Recent Comments
Link
말랑말랑제리스타일
[Pandas] null인 값 확인 및 채워넣기 본문
DataFrame의 모든 값이 꼭 채워져있으리란 법은 없습니다.
이번 장에서는 DataFrame의 null인 값을 확인하는 방법과 null인 값을 다른 값으로 채워넣는 방법을 알아봅시다.
import pandas as pd
test_df = pd.read_csv("/content/test.csv")
test_df[test_df.Age.isnull()] #1.null인 값 확인
test_df.Age = test_df.Age.fillna(test_df.Age.mean()) #2.null인 값 채우기
test_df.Embarked = test_df.Embarked.replace('C','1').replace('Q','2').replace('S','3') #3.값대체
1. null인 값 확인
DataFrame의 해당 컬럼에서 null인 값, 즉 Age가 비어있는 항목을 전부 조회할 때 사용 가능한 함수가 isnull()이라는 함수입니다.
Age가 null인 값들을 새로운 DataFrame으로 만들어줄 수 있습니다.
2. null인 값 채우기
null 인 값을 isnull() 함수로 확인해보고 null인 값이 존재할 시 fillna() 함수로 채우기가 가능합니다.
여기서 매개변수로는 채워줄 값이 됩니다.
3. 값 대체
null과 언뜻 관련없어보이지만 간혹 데이터에 unknown이라던지 null에 가까운 값이 있기도 합니다.
이런 경우 replace로 값을 대체해줄 수 있습니다. replace(바꿀 문자, 바뀔문자) 로 Pandas의 DataFrame에서 사용 가능한 함수입니다.
'프로그래밍 > 파이썬' 카테고리의 다른 글
[Pandas] DataFrame 합치기 - Union all 기능 (0) | 2022.01.23 |
---|---|
[Pandas]DataFrame 컬럼 명, 인덱스 수정 방법 (0) | 2022.01.22 |
[Pandas]DataFrame의 컬럼별 데이터 타입 확인 (0) | 2022.01.20 |
[Pandas] 판다스 DataFrame 데이터 정렬 (order by) (0) | 2022.01.20 |
[Pandas]판다스 group by 정리 (0) | 2022.01.19 |
Comments