[Matplotlib] Pandas의 시각화 기능

728x90

SMALL

Pandas의 시각화 기능

Pandas의 시리즈나 데이터프레임은 plot이라는 시각화 메서드를 내장하고 있다. plot은 matplotlib를 내부에서 임포트하여 사용한다.

np.random.seed(0)
df1 = pd.DataFrame(np.random.randn(100, 3),
                   index=pd.date_range('1/1/2018', periods=100),
                   columns=['A', 'B', 'C']).cumsum()
df1.tail()

df1.plot()
plt.title("Pandas의 Plot메소드 사용 예")
plt.xlabel("시간")
plt.ylabel("Data")
plt.show()

plot 메서드의 kind라는 인수를 바꾸면 여러가지 플롯을 그릴 수 있다.

bar
pie
hist
kde
box
scatter
area

iris = sns.load_dataset("iris")    # 붓꽃 데이터
titanic = sns.load_dataset("titanic")    # 타이타닉호 데이터

iris.sepal_length[:20].plot(kind='bar', rot=0)
plt.title("꽃받침의 길이 시각화")
plt.xlabel("Data")
plt.ylabel("꽃받침의 길이")
plt.show()

kind 인수에 문자열을 쓰는 대신 plot.bar처럼 직접 메서드로 사용할 수도 있다.

iris[:5].plot.bar(rot=0)
plt.title("Iris 데이터의 Bar Plot")
plt.xlabel("Data")
plt.ylabel("각 Feature의 값")
plt.ylim(0, 7)
plt.show()

df2 = iris.groupby(iris.species).mean()
df2.columns.name = "feature"
df2

df2.plot.bar(rot=0)
plt.title("각 종의 Feature별 평균")
plt.xlabel("평균")
plt.ylabel("종")
plt.ylim(0, 8)
plt.show()

df2.T.plot.bar(rot=0)
plt.title("각 Feature의 종 별 평균")
plt.xlabel("Feature")
plt.ylabel("평균")
plt.show()

df3 = titanic.pclass.value_counts()
df3.plot.pie(autopct='%.2f%%')
plt.title("선실별 승객 수 비율")
plt.axis('equal')
plt.show()

iris.plot.hist()
plt.title("각 Feature 값들의 빈도수 Histogram")
plt.xlabel("데이터 값")
plt.show()

iris.plot.kde()
plt.title("각 Feature 값들의 빈도수에 대한 Kernel Density Plot")
plt.xlabel("데이터 값")
plt.show()

iris.plot.box()
plt.title("각 Feature 값들의 빈도수에 대한 Box Plot")
plt.xlabel("Feature")
plt.ylabel("데이터 값")
plt.show()

iris.boxplot(by='species')
plt.tight_layout(pad=3, h_pad=1)
plt.title("각 Feature의 종 별 데이터에 대한 Box Plot")
plt.show()

https://datascienceschool.net/01%20python/05.05%20%ED%8C%90%EB%8B%A4%EC%8A%A4%EC%9D%98%20%EC%8B%9C%EA%B0%81%ED%99%94%20%EA%B8%B0%EB%8A%A5.html

Pandas의 시각화 기능 — 데이터 사이언스 스쿨

Pandas의 시각화 기능 Pandas의 시리즈나 데이터프레임은 plot이라는 시각화 메서드를 내장하고 있다. plot은 matplotlib를 내부에서 임포트하여 사용한다. np.random.seed(0) df1 = pd.DataFrame(np.random.randn(100, 3),

datascienceschool.net

728x90

LIST

저작자표시 비영리 변경금지 (새창열림)

'Python Library > Matplotlib' 카테고리의 다른 글

[Matplotlib] 공백 지우기 (0)	2023.04.27
[Matplotlib] 여러 개의 그래프 그리기 (0)	2022.03.02
[Matplotlib] Seaborn을 사용한 데이터 분포 시각화 (3) (0)	2022.02.22
[Matplotlib] Seaborn을 사용한 데이터 분포 시각화 (2) (0)	2022.02.22
[Matplotlib] Seaborn을 사용한 데이터 분포 시각화 (1) (0)	2022.02.22

GOATLAB

[Matplotlib] Pandas의 시각화 기능

Pandas의 시각화 기능

'Python Library > Matplotlib' 카테고리의 다른 글

티스토리툴바

[Matplotlib] Pandas의 시각화 기능

Pandas의 시각화 기능

'Python Library > Matplotlib' 카테고리의 다른 글

관련글

티스토리툴바