Seaborn : barplot&countplot

2022. 7. 3. 20:25Data Science/with Python(Numpy, Pandas …ect.)

Barplot과 Countplot 둘 다 막대형으로

데이터를 출력해준다는 공통점이 있다.

 

Barplot은 막대그래프를 그리자

라는 관점에서 우리가 흔히 Word나

Excel에서 보았던 막대그래프와 같다.

반면 Countplot은 말그대로 데이터가

몇 개가 있는지에 중점을 둔 것이다.

 

좀 더 디테일하게 비교하자면 Barpliot은

범주형 데이터, 수치형 데이터 상관없이

그 데이터의 수치값을 찍어준다.

예를 들면 몸무게의 평균, 키 평균.

 

다시 말하지만 Countplot은 개수를 센다.

종별 개수, 성별 개수 등등.

그렇다보니 수치형 정보가 아닌

범주형 정보를 count해준다.

 

Barplot

데이터에 대한 값의 크기를 막대로

보여주는 plot으로 우리가 흔히 '막대그래프'라고

알고 있는 것이다. 그러니 당연히 가로/세로

구분없이 출력이 가능하며 히스토그램과는

다르다는 것에 주의해야 한다.

# penguin 데이터에 barplot을 출력.
sns.barplot(data=penguins, x="flipper_length_mm", y="species", hue="species")

각 종별 전체 flipper_length의

평균값이 찍힌 것이다. 그리고

error bar를 통해 그 차이 정도를

나타내주고 있다.

 

만약 세로 그래프로 표현하고 싶다면

x, y만 바꿔주면 된다.

 

 

Countplot

범주형 속성을 가지는 데이터들의

히스토그램(histogram)을 보여주는 plot으로

종류 별 count를 보여주는 방법이다.

# penguin 데이터에 countplot을 출력.
## 종별 개체수
sns.countplot(data=penguins, x="species")

## 종별 분류를 하는데 sex별로 구분. 
sns.countplot(data=penguins, x="species", hue='sex')

(좌) 첫번째 코드,  (우) 두번째 코드

'Data Science > with Python(Numpy, Pandas …ect.)' 카테고리의 다른 글

Seaborn : lineplot&pointplot  (0) 2022.07.03
Seaborn : boxplot&violinplot  (0) 2022.07.03
Seaborn : histplot&displot  (0) 2022.07.03
Seaborn 란..  (0) 2022.07.03
Pandas 외부 데이터 읽고 쓰기  (0) 2022.06.30