DataFrame
DataFrame은 2차원 배열과 같이 행과 열로 구성된다. 행렬이라고 봐도 된다.
Dictionary to DataFrame
$dataFrame\; =\; pd.DataFrame(DICTIONARY)$
$DICTIONARY$의 키는 열 이름, 값은
당연히 $DICTIONARY$에는 value가 List 자료형인 딕셔너리만 올 수 있다.
전부 다 List일 필요는 없고 하나만 List여도 실행이 가능'하긴' 하다.
1
2
3
4
5
6
|
import pandas as pd
dict = {5: 'a', 6: [1, 2, 3], 7: 'c', 8:'d'}
df = pd.DataFrame(dict);
print(df)
|
cs |
List to DataFrame
$dataFrame\; =\; pd.DataFrame(TWO\_DIMENSION\_ARRAY,\; ROW\_INDEX\_ARRAY,\; COLUMN\_INDEX\_ARRAY)$
인덱스/열 이름 수정
$dataFrame.index=NEW\_INDEX\_ARRAY$
$dataFrame.columns=NEW\_INDEX\_ARRAY$
행/열 삭제
$drop(ROW\_INDEX, axis\;=\;0)$
$drop(ROW\_INDEX\_ARRAY, axis\;=\;0)$
$drop(COLUMN\_INDEX, axis\;=\;1)$
$drop(COLUMN\_INDEX\_ARRAY, axis\;=\;1)$
$cf.$ $axis$는 미지정할 수 없다.
행 선택
ⓐ 정수 인덱스
$iloc(INDEX)$
$iloc(ROW\_INDEX, COLUMN\_INDEX)$
$iloc([BEGIN\_INDEX:END\_INDEX])$
$iloc(INDEX)$은 다음과 같이 출력된다.
$column\; 1\;name\;\;\;\;element_1\; of\; INDEX-th\; row$
$column\; 2\;name\;\;\;\;element_2\; of\; INDEX-th\; row$
$\vdots$
$column\;n\; name\;\;\;\;element_n\; of\; INDEX-th\; row$
$cf.$ $iloc([BEGIN\_INDEX:END\_INDEX])$의 경우 $END\_INDEX-1$번째 행까지만 반환됨
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
import pandas as pd
dict = {5: 'a', 6: [1, 2, 3], 7: 'c', 8:'d'}
df = pd.DataFrame(dict);
print(df)
print('\n')
print(df.iloc[0])
print('\n')
print(df.iloc[0, 2])
print('\n')
print(df.iloc[0:2])
print('\n')
|
cs |
ⓑ 문자열 인덱스(이름) -> $loc[]$
$loc['INDEX1','INDEX2' ]$
$loc['BEGIN\_INDEX':'END\_INDEX']$
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
import pandas as pd
dict = {'a':[1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9], 'd':[10, 11, 12]}
df = pd.DataFrame(dict, ['x', 'y', 'z']);
print(df)
print('\n')
print(df.loc['x'])
print('\n')
print(df.loc[['x', 'y']])
print('\n')
print(df.loc['x':'z'])
print('\n')
|
cs |
'Programming > Python' 카테고리의 다른 글
[Pandas] Basic operations: Series (0) | 2021.03.18 |
---|