본문 바로가기

[Pandas] Basic operations: Series

Pandas의 1차 목표는 서로 다른 여러 유형의 데이터를 Series와 DataFrame라는 공통의 format으로 정리하는 것이다.

또한 $import\; pandas\; as\; pd$로 import 해서 라이브러리 참조 시 $pd$로 참조하는 것이 일반적이다.

 

Tuple, List, Dictionary 선언

Tuple: $TUPLE\_NAME = (e_1,\; e_2,\; [e_3,\; e_4],\; \cdots,\; e_n+$

List: $LIST\_NAME = [e_1,\; e_2,\; [e_3,\; e_4],\; \cdots,\; e_n]$

Dictionary: ${Key_1:Value_1,\; Key_2:Value_2,\; \cdots,\; Key_n:Value_n}$

* Dictionary의 Value에 List 등의 자료형도 줄 수 있다.

Series

Series는 1차원 배열과 같이 $Index-Value$의 일대일 대응으로 구성된다.

딕셔너리를 시리즈로 변환해 사용하는 것이 보통이다.

 

Dictionary to Series

$series\; =\; pd.Series(DICTIONARY)$

$DICTIONARY$의 key가 시리즈의 index로 변환된다.

별도로 index를 지정할 경우 원래 index와 동일하지 않은 값은 $NaN$으로 표시된다.

 

List to Series, Tuple to Series

$series\; =\; pd.Series(LIST, INDEX)$

$series\; =\; pd.Series(TUPLE, INDEX)$

$INDEX$를 지정하지 않을 경우 Default index인 $0, 1, 2, \dots$로 설정된다.

$INDEX$에는 List 또는 Tuple 타입을 줄 수 있다.

 

Access to index and values

$series.index$

$series.values$

로 접근할 수 있으며, 전자의 자료형은 $pandas.core.indexes.numeric.Int64Index$고

후자의 자료형은 $numpy.ndarray$다.

 

원소 접근

배열과 같이 $series[INDEX]$로 접근한다.

'Programming > Python' 카테고리의 다른 글

[Pandas] Basic operation: DataFrame  (0) 2021.03.22