Matplotlib を使用した Python によるデータ可視化
データの視覚化はデータ分析の重要な部分であり、データの洞察とパターンを明らかにするのに役立ちます。 Matplotlib
は、Python で静的、アニメーション、インタラクティブなプロットを作成するために最も広く使用されているライブラリの 1 つです。この記事では、Matplotlib を使用してさまざまな種類の視覚化を作成する方法について説明します。
Matplotlib を使い始める
Matplotlib を使い始めるには、まずそれをインストールする必要があります。Matplotlib は pip
を使用してインストールできます。
pip install matplotlib
インストールしたら、Python スクリプトに Matplotlib をインポートできます。
import matplotlib.pyplot as plt
基本的なプロットの作成
Matplotlib は、データを視覚化するためのいくつかの種類のプロットを提供します。まずは基本的な例から始めましょう。
折れ線グラフ
折れ線グラフは、時間の経過に伴う傾向や連続データを表示するのに便利です。簡単な折れ線グラフを作成する方法は次のとおりです。
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a line plot
plt.plot(x, y, marker='o')
plt.title('Simple Line Plot')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
plt.show()
棒グラフ
棒グラフは、異なるカテゴリ間で数量を比較する場合に便利です。棒グラフの例を次に示します。
import matplotlib.pyplot as plt
# Data
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 1, 8]
# Create a bar plot
plt.bar(categories, values)
plt.title('Simple Bar Plot')
plt.xlabel('Categories')
plt.ylabel('Values')
plt.show()
ヒストグラム
ヒストグラムは数値データの分布を表すために使用されます。ヒストグラムを作成する方法は次のとおりです。
import matplotlib.pyplot as plt
# Data
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]
# Create a histogram
plt.hist(data, bins=5, edgecolor='black')
plt.title('Histogram')
plt.xlabel('Bins')
plt.ylabel('Frequency')
plt.show()
プロットのカスタマイズ
Matplotlib では、プロットの広範なカスタマイズが可能で、読みやすさと美観が向上します。カスタマイズ オプションをいくつか紹介します。
ラベルとタイトルの追加
タイトル、軸ラベル、凡例を追加して、プロットにさらに情報を追加できます。
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a line plot with customization
plt.plot(x, y, marker='o', color='green', linestyle='--')
plt.title('Customized Line Plot')
plt.xlabel('X Axis Label')
plt.ylabel('Y Axis Label')
plt.legend(['Data Series'])
plt.grid(True)
plt.show()
プロットの保存
Matplotlib を使用すると、レポートやプレゼンテーションで使用するためにプロットを画像ファイルとして保存できます。
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a plot
plt.plot(x, y, marker='o')
plt.title('Line Plot to Save')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
# Save the plot as an image file
plt.savefig('line_plot.png')
結論
Matplotlib は、Python でさまざまな視覚化を作成するための強力なツールです。折れ線グラフ、棒グラフ、ヒストグラムの基本を習得し、グラフをカスタマイズして保存する方法を学習することで、データを効果的に視覚化し、貴重な洞察を得ることができます。さまざまな種類のグラフとカスタマイズ オプションを試して、データ分析プロジェクトで Matplotlib の機能を最大限に活用してください。