목록캐글 (3)
말랑말랑제리스타일
우선 앞선 글을 읽지 않고 이 글을 이해하기 힘들 수 있으니 블로그 내에 판다스 인덱싱-데이터 조회 글을 먼저 읽어주시기 바랍니다. 링크는 아래에 첨부합니다. https://jerry-style.tistory.com/47 [Pandas]판다스 인덱싱 - 데이터 조회 Pandas의 DataFrame과 Series에서 데이터를조회하는 작업은 거의 모든 분석에서 일어나는 작업으로 가장 먼저 해야될 작업 중 하나입니다. Native Accesors (접근자) 파이썬의 Native 객체는 데이터를 인덱싱 jerry-style.tistory.com 앞선 글에서 우리는 인덱스와 라벨을 이용해 데이터를 조회하는 방법을 알아보았습니다. 이번에는 인덱스를 조정하는 방법을 알아봅시다. 인덱스 조정 Label-Based se..
Pandas의 DataFrame과 Series에서 데이터를조회하는 작업은 거의 모든 분석에서 일어나는 작업으로 가장 먼저 해야될 작업 중 하나입니다. Native Accesors (접근자) 파이썬의 Native 객체는 데이터를 인덱싱하기 좋습니다. Pandas는 이걸 보다 쉽게 시작할 수 있게 도와줍니다. 지난 글에 이어서 이번에는 또다른 colab의 샘플 데이터를 가져와봅시다. test_df = pd.read_csv("/content/sample_data/california_housing_test.csv") test_df 파이썬에서 우리는 불러온 DataFrame의 속성 값 즉 컬럼을 이용해서 각 객체를 조회해볼 수 있습니다. 여기서 각 속성에 접근하기 위해 '.' 또는 '[]'를 이용해볼 수 있습니..
캐글을 본격적으로 시작해야지!! 하면 다들 타이타닉부터 하시죠 저 역시 타이타닉부터 시작했고 캐글 사이트가 한글 번역은 안돼있다보니 데이터셋의 내용이 뭔지도 잘 모르겠는 부분이 많았습니다 그래서 타이타닉 문제 데이터셋의 각 필드 내용을 번역해봤습니다 1. Survival : 생존여부입니다 1이면 Yes로 생존 0이면 No로 사망 2. PClass : 티켓 클래스로 1:퍼스트 클래스, 2: 세컨 클래스, 3: 서드 클래스로 1에 가까울수록 부유할 가능성이 높죠 3. 성별 : 영어로 이 단어를 써도 되나 모르겟어서 그냥 한글로 쓸게요 아시겠죠 male은 남성 female은 여성입니다 4. Age : 나이죠 이게 은근히 빈칸이 많아서 이걸 채우는것도 기술이라면 기술이겠죠 5.sibsp : 함께 탑승한 형제, ..