Pythonを使ってデータ解析を行う際には、NumPy、Pandas、Matplotlibといった外部ライブラリを活用します。
今回は、これらのライブラリの基本的な使い方を学んでいきます。
NumPy
NumPyは、Pythonで数値計算を効率的に行うためのライブラリです。配列や行列の操作が簡単にできます。
import numpy as np
# 配列の作成
array1 = np.array([1, 2, 3, 4, 5])
# 配列の演算
array2 = array1 * 2
print(array2)
# 行列の作成
matrix1 = np.array([[1, 2], [3, 4]])
# 行列の積
matrix2 = np.dot(matrix1, matrix1)
print(matrix2)
PR
Pandas
Pandasは、データ分析において頻繁に用いられるライブラリです。表形式のデータを効率的に操作できます。
import pandas as pd
# データフレームの作成
data = {
"Name": ["Alice", "Bob", "Charlie"],
"Age": [25, 30, 35],
"City": ["Tokyo", "Osaka", "Nagoya"]
}
df = pd.DataFrame(data)
# データの選択
selected_data = df[df["Age"] > 25]
# データの並べ替え
sorted_data = df.sort_values(by="Age", ascending=False)
PR
Matplotlib
Matplotlibは、Pythonでグラフを描画するためのライブラリです。さまざまなグラフを簡単に作成できます。
import matplotlib.pyplot as plt
# 折れ線グラフ
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.plot(x, y)
plt.show()
# 棒グラフ
x = ["A", "B", "C"]
y = [3, 6, 9]
plt.bar(x, y)
plt.show()
# 散布図
x = [1, 2, 3, 4, 5]
y = [5, 4, 3, 2, 1]
plt.scatter(x, y)
plt.show()
PR