groupby
- 다음과 같은 DataFrame 을 보유하고 있다고 가정하자.
code Countries
0 999 Switzerland
1 113 Switzerland
2 112 Japan
3 112 Switzerland
4 113 Canada
5 114 Japan
6 100 Germany
7 114 Japan
8 115 GermanyA.1) nunique
- 국가에 따라서 고유한 코드 개수가 몇 개 있는지 세어보자.
df.groupby('Countries')['code'].nunique()Countries
Canada 1
Germany 2
Japan 2
Switzerland 3
Name: code, dtype: int64B) unique
nunique와 비슷하지만 고유한 개수 대신, 값 자체를 리스트 형식으로 반환한다.df.groupby('Countries')["code"].unique()-
Countries
Canada [113]
Germany [100, 115]
Japan [112, 114]
Switzerland [999, 113, 112]
Name: code, dtype: object```
C) map
- 주어진
DataFrame또는Series에 입력값을 적용한다. - 딕셔너리 타입의 값을 입력받으면, 딕셔너리의
key와 동일한 값을value로 바꾼다.
예시
0 cat
1 dog
2 NaN
3 rabbit
dtype: object```
- `s.map({'cat': 'kitten', 'dog': 'puppy'})` 적용 후
- ```plain text
0 kitten
1 puppy
2 NaN
3 NaN
dtype: object