본문 바로가기

[Pandas] Basic operation: DataFrame

DataFrame

DataFrame은 2차원 배열과 같이 행과 열로 구성된다. 행렬이라고 봐도 된다.

 

Dictionary to DataFrame

$dataFrame\; =\; pd.DataFrame(DICTIONARY)$

$DICTIONARY$의 키는 열 이름, 값은

당연히 $DICTIONARY$에는 value가 List 자료형인 딕셔너리만 올 수 있다.

전부 다 List일 필요는 없고 하나만 List여도 실행이 가능'하긴' 하다.

1
2
3
4
5
6
import pandas as pd
 
dict = {5'a'6: [123], 7'c'8:'d'}
 
df = pd.DataFrame(dict);
print(df)
cs

 

List to DataFrame

$dataFrame\; =\; pd.DataFrame(TWO\_DIMENSION\_ARRAY,\; ROW\_INDEX\_ARRAY,\; COLUMN\_INDEX\_ARRAY)$

 

 

인덱스/열 이름 수정

$dataFrame.index=NEW\_INDEX\_ARRAY$

$dataFrame.columns=NEW\_INDEX\_ARRAY$

 

 

행/열 삭제

$drop(ROW\_INDEX, axis\;=\;0)$

$drop(ROW\_INDEX\_ARRAY, axis\;=\;0)$

$drop(COLUMN\_INDEX, axis\;=\;1)$

$drop(COLUMN\_INDEX\_ARRAY, axis\;=\;1)$

 

$cf.$ $axis$는 미지정할 수 없다.

 

 

행 선택

ⓐ 정수 인덱스

$iloc(INDEX)$

$iloc(ROW\_INDEX, COLUMN\_INDEX)$

$iloc([BEGIN\_INDEX:END\_INDEX])$

 

$iloc(INDEX)$은 다음과 같이 출력된다.

$column\; 1\;name\;\;\;\;element_1\; of\; INDEX-th\; row$

$column\; 2\;name\;\;\;\;element_2\; of\; INDEX-th\; row$

$\vdots$

$column\;n\; name\;\;\;\;element_n\; of\; INDEX-th\; row$

 

$cf.$ $iloc([BEGIN\_INDEX:END\_INDEX])$의 경우 $END\_INDEX-1$번째 행까지만 반환됨

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
 
dict = {5'a'6: [123], 7'c'8:'d'}
 
df = pd.DataFrame(dict);
print(df)
print('\n')
 
print(df.iloc[0])
print('\n')
 
print(df.iloc[02])
print('\n')
 
print(df.iloc[0:2])
print('\n')
cs

 

ⓑ 문자열 인덱스(이름) -> $loc[]$

$loc['INDEX1','INDEX2' ]$

$loc['BEGIN\_INDEX':'END\_INDEX']$

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
 
dict = {'a':[123], 'b': [456], 'c': [789], 'd':[101112]}
 
df = pd.DataFrame(dict, ['x''y''z']);
print(df)
print('\n')
 
print(df.loc['x'])
print('\n')
 
print(df.loc[['x''y']])
print('\n')
 
print(df.loc['x':'z'])
print('\n')
cs

 

 

 

 

 

 

 

 

 

 

'Programming > Python' 카테고리의 다른 글

[Pandas] Basic operations: Series  (0) 2021.03.18