DataFrame
DataFrame은 2차원 배열과 같이 행과 열로 구성된다. 행렬이라고 봐도 된다.
Dictionary to DataFrame
dataFrame=pd.DataFrame(DICTIONARY)dataFrame=pd.DataFrame(DICTIONARY)
DICTIONARYDICTIONARY의 키는 열 이름, 값은
당연히 DICTIONARYDICTIONARY에는 value가 List 자료형인 딕셔너리만 올 수 있다.
전부 다 List일 필요는 없고 하나만 List여도 실행이 가능'하긴' 하다.
1
2
3
4
5
6
|
import pandas as pd
dict = {5: 'a', 6: [1, 2, 3], 7: 'c', 8:'d'}
df = pd.DataFrame(dict);
print(df)
|
cs |

List to DataFrame
dataFrame=pd.DataFrame(TWO_DIMENSION_ARRAY,ROW_INDEX_ARRAY,COLUMN_INDEX_ARRAY)dataFrame=pd.DataFrame(TWO_DIMENSION_ARRAY,ROW_INDEX_ARRAY,COLUMN_INDEX_ARRAY)
인덱스/열 이름 수정
dataFrame.index=NEW_INDEX_ARRAYdataFrame.index=NEW_INDEX_ARRAY
dataFrame.columns=NEW_INDEX_ARRAYdataFrame.columns=NEW_INDEX_ARRAY
행/열 삭제
drop(ROW_INDEX,axis=0)drop(ROW_INDEX,axis=0)
drop(ROW_INDEX_ARRAY,axis=0)drop(ROW_INDEX_ARRAY,axis=0)
drop(COLUMN_INDEX,axis=1)drop(COLUMN_INDEX,axis=1)
drop(COLUMN_INDEX_ARRAY,axis=1)drop(COLUMN_INDEX_ARRAY,axis=1)
cf.cf. axisaxis는 미지정할 수 없다.
행 선택
ⓐ 정수 인덱스
iloc(INDEX)iloc(INDEX)
iloc(ROW_INDEX,COLUMN_INDEX)iloc(ROW_INDEX,COLUMN_INDEX)
iloc([BEGIN_INDEX:END_INDEX])iloc([BEGIN_INDEX:END_INDEX])
iloc(INDEX)iloc(INDEX)은 다음과 같이 출력된다.
column1nameelement1ofINDEX−throwcolumn1nameelement1ofINDEX−throw
column2nameelement2ofINDEX−throwcolumn2nameelement2ofINDEX−throw
⋮⋮
columnnnameelementnofINDEX−throwcolumnnnameelementnofINDEX−throw
cf.cf. iloc([BEGIN_INDEX:END_INDEX])iloc([BEGIN_INDEX:END_INDEX])의 경우 END_INDEX−1END_INDEX−1번째 행까지만 반환됨
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
import pandas as pd
dict = {5: 'a', 6: [1, 2, 3], 7: 'c', 8:'d'}
df = pd.DataFrame(dict);
print(df)
print('\n')
print(df.iloc[0])
print('\n')
print(df.iloc[0, 2])
print('\n')
print(df.iloc[0:2])
print('\n')
|
cs |

ⓑ 문자열 인덱스(이름) -> loc[]loc[]
loc[′INDEX1′,′INDEX2′]
loc[′BEGIN_INDEX′:′END_INDEX′]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
import pandas as pd
dict = {'a':[1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9], 'd':[10, 11, 12]}
df = pd.DataFrame(dict, ['x', 'y', 'z']);
print(df)
print('\n')
print(df.loc['x'])
print('\n')
print(df.loc[['x', 'y']])
print('\n')
print(df.loc['x':'z'])
print('\n')
|
cs |

'Programming > Python' 카테고리의 다른 글
[Pandas] Basic operations: Series (0) | 2021.03.18 |
---|