본문 바로가기
DS/데이터-PANDAS

PANDAS ST3 멀티 인덱스(다중 인덱스)2, names

by 시에라177 2022. 5. 23.

#멀티(다중)인덱스생성

 

0.기본방법

-DataFrame에선 멀티 인덱스를 []로 두번 감싸는 것에 주목.

-Sereies에선 딕셔너리의 키값을 튜플로 쌍을 만들어 멀티인덱스 생성. (딕셔너리로 시리즈를 만들땐 키값이 인덱스가 됨)

-그러나 이렇게 만들기에는 과정이 너무 번거로움.

1.pd.MultiIndex.from_arrays()

-array들을 입력받아 멀티 인덱스를 만든다. [] 사용에 주의

 

2.pd.MultiIndex.from_tuples()

-튜플로 멀티인덱스를 만든다. 이 때 튜플들을 []로 감싸야 한다.

3.pd.MultiIndex.from_tuples()

-두 반복가능한 자료형을 입력받아 곱으로 멀티인덱스를 만든다.

위의 방법들로 멀티 인덱스 혹은 멀티 칼럼을 만들어 pandas객체 인자로 넘기면 멀티인덱스(칼럼)을 가진 데이터셋 만들 수 있음.

 

#names

names를 이용하면 인덱스와 컬럼에도 이름을 붙일 수 있다. 멀티 인덱스에서 사용시 각 레벨 별로 사용할 수도 있다.

 

0.기본예시

1.pd.MultiIndex.from_ 의 인자로 사용하기

 

#stack()과 unstack()

-stack()은 컬럼을 인덱스로 가져온다(칼럼의 인덱스화). 참고로 DataFrame을 Series로 변환시킨다.

-unstack()은 인덱스를 컬럼을 내보낸다(인덱스의 칼럼화). 멀티인덱스 Series를 DataFrame으로 변환시킨다.

위의 데이터셋에 unstack을 한 결과는

unstack을 다시 stack하면