Pandas 란?
Python의 패키지중 하나로서 쉽고 직관적인 관계형 또는 분류된 데이터로 작업할 수 있도록 설계되었으며,
표현이 풍부한 데이터 구조를 제공한다.
Pandas 패키지 import 하기
numpy 도 함께 import 해준다.
1차원 Series 출력하기
Series를 정의할 때 대소문자 구분을 확실히 해줘야 하며, 앞에 pd. 을 붙여서 Pandas 호출을 꼭 해주어야 한다.
그리고 Series는 Python의 list [ ] 나 Numpy의 array 가 인자로 입력된다.
출력을 하게 되면, 위 사진처럼 key 값과 value 값이 같이 나오게된다.
Python의 dictionary 기능과 유사하다.
Key, value 따로 호출하기
value 값을 따로, key 값을 따로 호출할 수 있으며, 인덱스 기능과, 슬라이싱 기능 모두 지원이 가능하다.
1번 인덱스를 호출하고, 1~4 슬라이스 부분을 출력하였다.
임의로 Index 값 지정하기
Series에서 index를 따로 설정이 가능하다.
숫자였던 인덱스를 알파벳으로 재인덱싱설정을 한 모습이다.
주의할점은 재설정하려는 인덱스의 개수가 value값의 개수와 서로 매칭 되지 않으면
(어느 한쪽이 더 적거나 많으면)
보다시피 에러가 발생한다.
Index 값을 이용한 호출
변경한 index 값으로 호출도 가능하며, 특정 인덱스들을 동시에 호출이 가능하다.
* 'c' index에 매칭 되는 값을 호출하고 'c', 'd', 'e'를 동시에 호출하였다.
위 이미지처럼 1, 2, 3, 4 혹은 a, b, c, d 처럼 반드시 연속하지 않아도 인덱스 지정이 가능하다.
unique 기능
1, 1, 2, 2, 3, 3, 4 의 값을 가진 a라는 Series를 생성해보았다.
여기에 unique 기능을 적용해보겠다.
그 결과 중복되던 여러값들이 다 나오는 것이 아닌
대표값들만 하나씩 출력이 되는 것을 알 수 있다.
value_counts 기능
바로 이어서 각각의 값들이 해당 Series에 몇 개씩 있는지 확인시켜주는 value_counts 기능도 보자
왼쪽 열이 값이고 오른쪽 열이 개수이다.
즉 3이라는 값이 2개, 2라는 값이 2개, 1이라는 값이 2개, 4라는 값은 1개라는 것을 알 수 있다.
3 2개
2 2개
1 2개
4 1개
Dictionary 값 Series로 입력하기
딕셔너리 값을 통째로 Series로 입력이 가능하다.
마찬가지로 새롭게 지정된 인덱스를 통해 개별 호출과 슬라이싱을 이용한 호출도 가능하다.
'Python' 카테고리의 다른 글
분기 속 분기 구분 및 체크의 중요성(분기문) (0) | 2021.03.15 |
---|---|
Pandas 기본 파헤치기(DataFrame) (0) | 2020.09.08 |
Python(6) - 반복문(while, for, break, continue) (0) | 2020.08.21 |
Python(5) - 조건문 알아보기(If, else, elif, pass) (0) | 2020.08.20 |
Python(4) - List(리스트)란? (0) | 2020.08.12 |