#멀티(다중)인덱스생성
0.기본방법
-DataFrame에선 멀티 인덱스를 []로 두번 감싸는 것에 주목.
-Sereies에선 딕셔너리의 키값을 튜플로 쌍을 만들어 멀티인덱스 생성. (딕셔너리로 시리즈를 만들땐 키값이 인덱스가 됨)
-그러나 이렇게 만들기에는 과정이 너무 번거로움.


1.pd.MultiIndex.from_arrays()
-array들을 입력받아 멀티 인덱스를 만든다. [] 사용에 주의

2.pd.MultiIndex.from_tuples()
-튜플로 멀티인덱스를 만든다. 이 때 튜플들을 []로 감싸야 한다.

3.pd.MultiIndex.from_tuples()
-두 반복가능한 자료형을 입력받아 곱으로 멀티인덱스를 만든다.

위의 방법들로 멀티 인덱스 혹은 멀티 칼럼을 만들어 pandas객체 인자로 넘기면 멀티인덱스(칼럼)을 가진 데이터셋 만들 수 있음.
#names
names를 이용하면 인덱스와 컬럼에도 이름을 붙일 수 있다. 멀티 인덱스에서 사용시 각 레벨 별로 사용할 수도 있다.
0.기본예시

1.pd.MultiIndex.from_ 의 인자로 사용하기

#stack()과 unstack()
-stack()은 컬럼을 인덱스로 가져온다(칼럼의 인덱스화). 참고로 DataFrame을 Series로 변환시킨다.
-unstack()은 인덱스를 컬럼을 내보낸다(인덱스의 칼럼화). 멀티인덱스 Series를 DataFrame으로 변환시킨다.

위의 데이터셋에 unstack을 한 결과는

unstack을 다시 stack하면

'DS > 데이터-PANDAS' 카테고리의 다른 글
| PANDAS ST5 그룹바이 집계하기 (0) | 2022.10.02 |
|---|---|
| PANDAS ST4 특정 행/열 위치교환 (0) | 2022.09.17 |
| PANDAS ST3 멀티 인덱스(다중 인덱스)1 (0) | 2022.05.23 |
| PANDAS ST2 인덱싱(특정 행/열 선택, 추출, 라벨추출, 값만 추출) (0) | 2022.05.23 |
| PANDAS ST1 Index(색인)객체 (0) | 2022.05.21 |