Python

Pandas 기본 파헤치기(Series)

개발하길잘햇다 2020. 9. 7. 01:17
반응형

Pandas 란?

Python의 패키지중 하나로서 쉽고 직관적인 관계형 또는 분류된 데이터로 작업할 수 있도록 설계되었으며,

표현이 풍부한 데이터 구조를 제공한다.

 

 


Pandas 패키지 import 하기

 

 

numpy 도 함께 import 해준다.

 

 


1차원 Series 출력하기

 

Series 출력

 

Series를 정의할 때 대소문자 구분을 확실히 해줘야 하며, 앞에 pd. 을 붙여서 Pandas 호출을 꼭 해주어야 한다.

 

그리고 Series는 Python의 list [ ] 나 Numpy의 array 가 인자로 입력된다.

 

출력을 하게 되면, 위 사진처럼 key 값과 value 값이 같이 나오게된다. 

 

Python의 dictionary 기능과 유사하다.

 


Key, value 따로 호출하기

 

key, value 따로 호출

 

 

value 값을 따로, key 값을 따로 호출할 수 있으며, 인덱스 기능과, 슬라이싱 기능 모두 지원이 가능하다.

 

 

 

인덱스, 슬라이싱 기능

 

1번 인덱스를 호출하고, 1~4 슬라이스 부분을 출력하였다.

 

 


임의로 Index 값 지정하기

 

 

 

 

Series에서 index를 따로 설정이 가능하다. 

숫자였던 인덱스를 알파벳으로 재인덱싱설정을 한 모습이다.

 

 

 

 

 

주의할점은 재설정하려는 인덱스의 개수가 value값의 개수와 서로 매칭 되지 않으면

(어느 한쪽이 더 적거나 많으면)

보다시피 에러가 발생한다.

 

 


Index 값을 이용한 호출

 

 

 

변경한 index 값으로 호출도 가능하며, 특정 인덱스들을 동시에 호출이 가능하다.

 

* 'c' index에 매칭 되는 값을 호출하고 'c', 'd', 'e'를 동시에 호출하였다.

 

 

 

 

 

 

 

 

위 이미지처럼 1, 2, 3, 4 혹은 a, b, c, d 처럼 반드시 연속하지 않아도 인덱스 지정이 가능하다.

 

 

 


unique 기능

 

 

1, 1, 2, 2, 3, 3, 4 의 값을 가진 a라는 Series를 생성해보았다.

 

여기에 unique 기능을 적용해보겠다.

 

 

 

그 결과 중복되던 여러값들이 다 나오는 것이 아닌

 

대표값들만 하나씩 출력이 되는 것을 알 수 있다.

 

 


value_counts 기능

 

바로 이어서 각각의 값들이 해당 Series에 몇 개씩 있는지 확인시켜주는 value_counts 기능도 보자

 

왼쪽 열이 값이고 오른쪽 열이 개수이다.

즉 3이라는 값이 2개, 2라는 값이 2개, 1이라는 값이 2개, 4라는 값은 1개라는 것을 알 수 있다.

 

3        2개

2        2개

1         2개

4         1개

 

 

 


Dictionary 값 Series로 입력하기

 

 

딕셔너리 값을 통째로 Series로 입력이 가능하다.

 

 

 

 

 

마찬가지로 새롭게 지정된 인덱스를 통해 개별 호출과 슬라이싱을 이용한 호출도 가능하다.

반응형