본문 바로가기

[Pandas] Basic operation: DataFrame

DataFrame

DataFrame은 2차원 배열과 같이 행과 열로 구성된다. 행렬이라고 봐도 된다.

 

Dictionary to DataFrame

dataFrame=pd.DataFrame(DICTIONARY)dataFrame=pd.DataFrame(DICTIONARY)

DICTIONARYDICTIONARY의 키는 열 이름, 값은

당연히 DICTIONARYDICTIONARY에는 value가 List 자료형인 딕셔너리만 올 수 있다.

전부 다 List일 필요는 없고 하나만 List여도 실행이 가능'하긴' 하다.

1
2
3
4
5
6
import pandas as pd
 
dict = {5'a'6: [123], 7'c'8:'d'}
 
df = pd.DataFrame(dict);
print(df)
cs

 

List to DataFrame

dataFrame=pd.DataFrame(TWO_DIMENSION_ARRAY,ROW_INDEX_ARRAY,COLUMN_INDEX_ARRAY)dataFrame=pd.DataFrame(TWO_DIMENSION_ARRAY,ROW_INDEX_ARRAY,COLUMN_INDEX_ARRAY)

 

 

인덱스/열 이름 수정

dataFrame.index=NEW_INDEX_ARRAYdataFrame.index=NEW_INDEX_ARRAY

dataFrame.columns=NEW_INDEX_ARRAYdataFrame.columns=NEW_INDEX_ARRAY

 

 

행/열 삭제

drop(ROW_INDEX,axis=0)drop(ROW_INDEX,axis=0)

drop(ROW_INDEX_ARRAY,axis=0)drop(ROW_INDEX_ARRAY,axis=0)

drop(COLUMN_INDEX,axis=1)drop(COLUMN_INDEX,axis=1)

drop(COLUMN_INDEX_ARRAY,axis=1)drop(COLUMN_INDEX_ARRAY,axis=1)

 

cf.cf. axisaxis는 미지정할 수 없다.

 

 

행 선택

ⓐ 정수 인덱스

iloc(INDEX)iloc(INDEX)

iloc(ROW_INDEX,COLUMN_INDEX)iloc(ROW_INDEX,COLUMN_INDEX)

iloc([BEGIN_INDEX:END_INDEX])iloc([BEGIN_INDEX:END_INDEX])

 

iloc(INDEX)iloc(INDEX)은 다음과 같이 출력된다.

column1nameelement1ofINDEXthrowcolumn1nameelement1ofINDEXthrow

column2nameelement2ofINDEXthrowcolumn2nameelement2ofINDEXthrow

columnnnameelementnofINDEXthrowcolumnnnameelementnofINDEXthrow

 

cf.cf. iloc([BEGIN_INDEX:END_INDEX])iloc([BEGIN_INDEX:END_INDEX])의 경우 END_INDEX1END_INDEX1번째 행까지만 반환됨

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
 
dict = {5'a'6: [123], 7'c'8:'d'}
 
df = pd.DataFrame(dict);
print(df)
print('\n')
 
print(df.iloc[0])
print('\n')
 
print(df.iloc[02])
print('\n')
 
print(df.iloc[0:2])
print('\n')
cs

 

ⓑ 문자열 인덱스(이름) -> loc[]loc[]

loc[INDEX1,INDEX2]

loc[BEGIN_INDEX:END_INDEX]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
 
dict = {'a':[123], 'b': [456], 'c': [789], 'd':[101112]}
 
df = pd.DataFrame(dict, ['x''y''z']);
print(df)
print('\n')
 
print(df.loc['x'])
print('\n')
 
print(df.loc[['x''y']])
print('\n')
 
print(df.loc['x':'z'])
print('\n')
cs

 

 

 

 

 

 

 

 

 

 

'Programming > Python' 카테고리의 다른 글