데이터 준비하기: 조인, 병합, 변형
1. 계층적 색인계층적 색인(hierarchical indexing)은 판다스의 중요한 기능이며 축에 대해 둘 이상의 색인 단계를 지정할 수 있도록 한다.고차원의 데이터를 낮은 차원의 형식으로 다룰 수 있게 해주는 기능이다.data = pd.Series(np.random.uniform(size=9),index=[["a","a","a","b","b","c","c","d","d"],[1,2,3,1,3,1,2,2,3]]data# 출력결과a 1 0.929616 2 0.316376 3 0.183919 b 1 0.204560 3 0.567725 c 1 0.595545 2 0.964515 d 2 0.653177 3 0.748907 위 객체는 MultiIndex를 색인으로 하는 Series이며 색인의 ..
2024. 6. 17.
판다스 시작하기: 핵심기능 및 기술 통계 계산
2. 핵심 기능1) 재색인, reindex()obj = pd.Series([4.5, 7.2, -5.3, 3.6], index=["d","b","a","c"])obj2 = obj.reindex(["a", "b", "c", "d", "e"])ffill 같은 메서드를 이용해 누락된 값을 직전의 값으로 채워넣을 수 있따.obj.reindex(np.arrange(6), method="ffill")행, 열 또는 둘 다 변경 가능하다.reindex 인수labels: 색인으로 사용할 새로운 순서, Index 인스턴스나 다른 순차적인 파이썬 자료구조를 사용할 수 있다.index: 새로운 index 지정columns: 새로운 columns 지정axis: 색인으로 사용할 열 지정method: 채움 메서드 ffill,은 직전..
2024. 6. 2.