Pandas★基本のキ

2021年3月17日

Pandasとは

numpyなどで作成したデータをキレイに表示したり、データの追加や絞り込みを効果的にしてくれる便利なライブラリです。

Pandasの基礎 SeriesとDataFrame

Series 一次元データを取り扱う

一次元のデータを取り扱う時は主にSeriesを使います。

書き方

pandas.Series( data, index )

data配列、辞書、イテレータなど
index一次元の配列

pandas.Series 詳細

【例】
import pandas as pd
pd.Series([0.25, 0.5, 0.75, 1.0],
          index=[2, 5, 3, 7])
2    0.25
5    0.50
3    0.75
7    1.00
dtype: float64

1重括弧はSeries

Pandasで表す配列の形が1重括弧の場合、データ形式はSeriesを意味します。

df['data']        # Series
df['data'].shape  # (n,)

DataFrame 二次元のデータを取り扱う

二次元のデータを取り扱う時はDataFrameを用います。

書き方

pandas.DataFrame( data, index, columns )

datandarray、イテレータ、辞書、Series、DataFrame
indexインデックスに使う配列
columnsカラムに使う配列

pandas.DataFrame 詳細

【例】
import numpy as np
import pandas as pd
pd.DataFrame(np.random.rand(3, 2),
             index=['a', 'b', 'c'],
             columns=['foo', 'bar'])
	foo 	        bar
a 	0.307821 	0.728094
b 	0.317437 	0.381374
c 	0.746845 	0.969314

2重括弧はDataFrame

Pandasで表す配列の形が2重括弧の場合、データ形式はDataFrameを意味します。

df[['data']]       # DataFrame
df[['data']].shape # (n,1)

Index

Indexはpandasオブジェクト(SeriesやDataFrame)のインデックスとして使用されます。また、Indexの値はイミュータブル(変更不可)です。

書き方

pandas.Index( data )

data配列

pandas.Index 詳細

【例】
import pandas as pd
pd.Index([2, 3, 7, 5, 11])
Int64Index([2, 3, 7, 5, 11], dtype='int64')

Pandas

Posted by Bright_Noah