목록집계함수 (2)
말랑말랑제리스타일
오라클이나 MS-SQL 등 RDB를 사용해보신 분들은 모두 익히 잘 알고있을만한 기능, group by 절은 판다스에도 존재합니다. 이름 역시 group by와 동일하게 DataFrame.groupby(조건) 으로 사용 가능하죠. 그럼 지금부터 실제 코드와 함께 살펴봅시다. 1. 싱글 group by 사용 test_df.groupby('Pclass').Pclass.count() test_df.groupby('Pclass').Age.min() 이와 같이 "DataFrame.groupby(그루핑할 필드).출력할필드.그룹함수" 형태로 판다스의 group by 절을 사용할 수 있습니다. 판다스에서 데이터 매핑을 하기 위한 apply와 데이터 조회를 하기 위한 loc 또는 iloc를 이용해서 group by 절을..
판다스를 사용하다보면 올바른 결과를 얻기위해서 데이터를 가공하거나 추출해낼 필요가 있습니다. 이때 사용 가능한 함수가 바로 판다스의 데이터 집계함수로 엑셀이나 SQL 등에서 사용하는 집계함수와 역할은 동일합니다. 먼저 테스트에 사용할 데이터는 캐글 타이타닉 문제의 test.csv 데이터를 사용하겠습니다. 혹시 올리는 방법을 모르겠으면 아래 글을 참고 바랍니다. https://jerry-style.tistory.com/49 구글 Colab에 외부 파일 올리기 구글 Colab에 외부 데이터를 올리는 방법입니다. Colab이 뭔지는 다들 알고 들어왔을거라고 생각하고 바로 외부파일 올리는 방법 알려드립니다. Colab에서 최초 노트를 생성하고 좌측을 확인해보면 jerry-style.tistory.com 판다스는..