Pandas의 1차 목표는 서로 다른 여러 유형의 데이터를 Series와 DataFrame라는 공통의 format으로 정리하는 것이다.
또한 $import\; pandas\; as\; pd$로 import 해서 라이브러리 참조 시 $pd$로 참조하는 것이 일반적이다.
Tuple, List, Dictionary 선언
Tuple: $TUPLE\_NAME = (e_1,\; e_2,\; [e_3,\; e_4],\; \cdots,\; e_n+$
List: $LIST\_NAME = [e_1,\; e_2,\; [e_3,\; e_4],\; \cdots,\; e_n]$
Dictionary: ${Key_1:Value_1,\; Key_2:Value_2,\; \cdots,\; Key_n:Value_n}$
* Dictionary의 Value에 List 등의 자료형도 줄 수 있다.
Series
Series는 1차원 배열과 같이 $Index-Value$의 일대일 대응으로 구성된다.
딕셔너리를 시리즈로 변환해 사용하는 것이 보통이다.
Dictionary to Series
$series\; =\; pd.Series(DICTIONARY)$
$DICTIONARY$의 key가 시리즈의 index로 변환된다.
별도로 index를 지정할 경우 원래 index와 동일하지 않은 값은 $NaN$으로 표시된다.
List to Series, Tuple to Series
$series\; =\; pd.Series(LIST, INDEX)$
$series\; =\; pd.Series(TUPLE, INDEX)$
$INDEX$를 지정하지 않을 경우 Default index인 $0, 1, 2, \dots$로 설정된다.
$INDEX$에는 List 또는 Tuple 타입을 줄 수 있다.
Access to index and values
$series.index$
$series.values$
로 접근할 수 있으며, 전자의 자료형은 $pandas.core.indexes.numeric.Int64Index$고
후자의 자료형은 $numpy.ndarray$다.
원소 접근
배열과 같이 $series[INDEX]$로 접근한다.
'Programming > Python' 카테고리의 다른 글
[Pandas] Basic operation: DataFrame (0) | 2021.03.22 |
---|