본문 바로가기
DS/데이터-PANDAS

PANDAS ST3 멀티 인덱스(다중 인덱스)1

by 시에라177 2022. 5. 23.

#멀티 인덱스란?

-한 인덱스가 여러 단계를 가지는 것. 단일 인덱스 내에 여러 인덱스를 포함하는 것.

ex) 인구수 데이터프레임의 '서울시'의 인구 인덱스를 2010년 2020년으로 나눈 것.

-판다스에서 1차원과 2차원을 넘는 고차원 데이터 처리에 필요.

-level은 멀티인덱스에서 인덱스의 계층을 말한다.

-멀티 인덱스 형식을 컬럼에 적용하면 멀티컬럼이다.

-멀티인덱스&멀티칼럼 둘다 있지만 일반적으로 둘다 그냥 멀티인덱스라고 부르는 듯.

 

내가 생각하기 가장 쉽게 설명되어있는 곳 링크: https://wikidocs.net/160716

 

10) 멀티인덱스 (Multi-Index)

[TOC] ## 멀티인덱스 엑셀에서는 셀(Cell)을 병합하는 형태로 여러 컬럼으로 구분된 구조적인 데이터를 표현할 수 있습니다. 데이터프레임에서는 이를 멀티인덱스라고 ...

wikidocs.net

-처음에 멀티인덱스를 이해하기 어려웠다. 그래서 간단한 예시가 필요할 듯.(아래의 데이터 셋은 그냥 아무거나 때려 넣었기 때문에 데이터 내용은 무시)

여기 까진 그냥 Series를 만드는 과정이다.

그런데 여기서 다음과 같이멀티인덱스를 생성하고

reindex해주면 멀티인덱스를 가진 데이터셋을 만들 수 있다.

인덱싱과 슬라이싱도 가능하다.

 

 

멀티인덱스 2: https://runtimeerror44.tistory.com/77

 

PANDAS ST3 멀티 인덱스(다중 인덱스)2, names

#멀티(다중)인덱스생성 0.기본방법 -DataFrame에선 멀티 인덱스를 []로 두번 감싸는 것에 주목. -Sereies에선 딕셔너리의 키값을 튜플로 쌍을 만들어 멀티인덱스 생성. (딕셔너리로 시리즈를 만들땐 키

runtimeerror44.tistory.com