목록프로그래밍 (115)
말랑말랑제리스타일

Pandas의 DataFrame과 Series에서 데이터를조회하는 작업은 거의 모든 분석에서 일어나는 작업으로 가장 먼저 해야될 작업 중 하나입니다. Native Accesors (접근자) 파이썬의 Native 객체는 데이터를 인덱싱하기 좋습니다. Pandas는 이걸 보다 쉽게 시작할 수 있게 도와줍니다. 지난 글에 이어서 이번에는 또다른 colab의 샘플 데이터를 가져와봅시다. test_df = pd.read_csv("/content/sample_data/california_housing_test.csv") test_df 파이썬에서 우리는 불러온 DataFrame의 속성 값 즉 컬럼을 이용해서 각 객체를 조회해볼 수 있습니다. 여기서 각 속성에 접근하기 위해 '.' 또는 '[]'를 이용해볼 수 있습니..

두번째 판다스 강좌입니다. 강좌라고 하기에 앞서 말한 것과 같이 Kaggle에 있는 과정을 번역하고 약간 가공한 내용이긴 하지만 그래도 개인적으로 많은 도움이 되었기에 계속 이어나가봅니다. 두번째 판다스 강좌는 데이터를 Read 즉 읽어오는 과정입니다. 앞선 강좌에서 Pandas의 대표 객체인 DataFrame과 Series를 생성하는걸 학습했습니다. 그러나 대부분의 데이터 분석에서는 이미 만들어져있는 데이터를 불러와서 사용하게 됩니다. 그중 가장 많이 사용하는 파일 포맷은 CSV 포맷으로 콤마(,)로 구분된 텍스트 문서입니다. 참고로 엑셀에서도 열리지만 데이터 외의 내용은 저장되지 않고 포맷상 콤마(,)를 데이터로 사용할 수 없는 파일 포맷입니다. 실제로 데이터 불러오기 이제 실제로 pd.read_cs..

먼저 이 글은 Kaggle의 Course에 있는 판다스 튜토리얼을 참고한 글입니다. Kaggle 사이트의 튜토리얼은 일단 정말 잘되어있고 따라하면서 배우기 굉장히 좋았습니다. 다만 Kaggle 사이트가 영어로만 되어있다 보니 한글이 더 편한 저같은 분들을 위해 번역과 같단한 의견을 추가해봤습니다. 그럼 지금부터 Pandas를 시작하고 데이터를 생성하고 입출력하는 과정을 시작해봅시다. 먼저 판다스란 가장 유명한 파이썬 데이터 분석 라이브러리입니다. 이 첫번째 과정에서 이미 존재하는 데이터를 이용해 데이터를 생성해보겠습니다. 판다스 시작하기 판다스를 시작하기 위해서는 일단 Pandas 라이브러리를 import해야겠죠. 다른 라이브러리와 마찬가지로 import와 as를 이용해 pandas를 pd라는 명칭으로 ..

백준11729번 문제는 하노이탑 이동 순서 문제입니다. 하노이탑 이동 문제는 대표적인 재귀함수로 풀기 쉬운 문제이며, 재귀함수를 이해하기에도 좋은 문제입니다. 자 그럼 여기서 하노이탑 문제란 뭐냐? 다들 이런식으로 생긴 장난감 본적 있을겁니다. 왼쪽처럼 생긴 모양을 오른쪽 모양으로 옮기는 문제이며, 여기서 작은 원판 위에는 큰 원판이 올 수 없습니다. 기본적인 하노이탑 이동 문제의 이동 규칙이며, 백준 알고리즘 11729 문제는 이 하노이탑에서 원판을 이동하는 순서와 전체 이동 횟수를 출력하는 문제입니다. 일단 파이썬으로 작성된 코드부터 보고 본격적으로 코드 및 문제 설명 들어갑니다 백준 11729 답안 파이썬 코드 def movement(n,f,e,t,Arr): #f에서 t로 이동한다 e는 비어있는 공..
재귀함수(Recursion)의 정의 재귀함수의 재귀는 한자로 두번 재에 돌아올 귀자를 써서 再歸 라고 표현됩니다. 영어로는 Recursion이라고 표현합니다. 실제 코드에서는 어떤 함수 안에서 그함수 자신을 호출하는 함수를 재귀함수(Recursion)라고 표현합니다. 재귀함수 구현방법 재귀함수의 요건 종료조건(기저조건) 재귀함수에서 필수적인 요소가 바로 종료조건입니다. 아래 코드에서 종료조건이라고 주석처리한 라인이 없다면 무한히 루프를 돌다가 결국 스택오버플로우를 일으키고 프로그램이 죽습니다. 그래서 어느 조건에 도달하면 이 함수를 끝낸다는종료조건을 넣어주어야 합니다. func recursive(){ func recursive() if(종료조건) //종료조건 return //종료조건 } 분할정복 재귀함..
캐글을 본격적으로 시작해야지!! 하면 다들 타이타닉부터 하시죠 저 역시 타이타닉부터 시작했고 캐글 사이트가 한글 번역은 안돼있다보니 데이터셋의 내용이 뭔지도 잘 모르겠는 부분이 많았습니다 그래서 타이타닉 문제 데이터셋의 각 필드 내용을 번역해봤습니다 1. Survival : 생존여부입니다 1이면 Yes로 생존 0이면 No로 사망 2. PClass : 티켓 클래스로 1:퍼스트 클래스, 2: 세컨 클래스, 3: 서드 클래스로 1에 가까울수록 부유할 가능성이 높죠 3. 성별 : 영어로 이 단어를 써도 되나 모르겟어서 그냥 한글로 쓸게요 아시겠죠 male은 남성 female은 여성입니다 4. Age : 나이죠 이게 은근히 빈칸이 많아서 이걸 채우는것도 기술이라면 기술이겠죠 5.sibsp : 함께 탑승한 형제, ..

오버라이딩과 오버로딩은 명확히 다른 개념인데 이름이 비슷하다 보니까 종종 헷갈려 하시는 분들이 있더라구요 일단 메서드 오버로딩은 뭐냐? 매개변수의 타입(자료형) 또는 개수가 다르고 이름만 같은 함수를 말합니다 namespace overloading_and_overriding { class Program { static void Main(string[] args) { print_hello(3); print_hello("HELLO"); Console.WriteLine(print_hello(3,"hello")); } static void print_hello(int n) { for (int i = 0; i < n; i++) { Console.WriteLine("hello"); } } static string ..
모든 프로그래밍 언어에는 자료형이 존재하고 파이썬도 예외 없이 자료형이라는게 있는데요 이 자료형이 뭐냐? 변수를 저장하는 양식이죠 예를 들어서 0은 숫자로 "안녕"은 문자열로 저장하는건데 이 자료형의 종류가 파이썬은 그렇게 많은 편은 아닌 것 같습니다 일단 파이썬 자료형 중 숫자형을 보면 int, float, complex가 있는데요 int : 정수형이죠 일반적으로 C에서는 4바이트 정수형인데 반해 파이썬의 int는 크기가 무제한입니다 매우 특이하죠 float : 실수입니다 소수점을 포함한 숫자이고 8바이트로 일반적으로 C나 java에서는 double에 더 가까운 자료형이죠 complex : 복소수입니다 실수 + 허수이고 일반적으로 기본자료형에 잘 없는 자료형인데 있는걸로 봐서 파이썬이 계산에 특화된 언..