区間推定とは

2021年2月12日

色んなことを予測するのにピンポイントで予測するよりざっくり予測した方が範囲が広いので正解しやすくなります。例えば

「あの人、顔にシミがあるから35歳くらいだよね」

と言うより

「あの人、顔にシミがあるから30代だね」

と言った方が範囲が広くなり予測精度があがります。これが区間推定です。

 

区間推定とは

例えばこんな言い方をします。

  • テレビの視聴率は9%~12%の間にある
    (信頼係数95%)

とか

  • ハンバーガーの重さの平均は200g~210gの間にある
    (信頼係数99%)

具体的な一つの数字で予想するのではなく、もう少し大雑把に予想に幅を持たせるのが区間推定です。信頼係数は予想した幅に値がちゃんと入っている確率です。

区間推定の式

区間推定は「○○~○○」みたいに、ある範囲を求めます。それが信頼区間と言われるもので次のような式になります。

\begin{eqnarray}
\bar{X}-k\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+k\frac{\sigma}{\sqrt{n}}
\end{eqnarray}

標本の平均値 $\bar{X}$
両側$100(1-\alpha)$%点 $k$
母数 $n$
母標準偏差 $\sigma$
標準誤差
(標本平均の標準偏差)
$\frac{\sigma}{\sqrt{n}}$

ここで両側$100(1-\alpha)$%点というよくわからない物が登場しました。これは信頼度と関係があります。

信頼度(信頼係数)とは、それが正解である確率のことです。

信頼度はこちらで設定してあげる必要があり、99%や95%などの数字を設定してあげます。標準正規分布表を使うことによりその数字から両側$100(1-\alpha)$%点の値は自ずと求めることができます。

一部を抜粋すると、信頼度と両側$100(1-\alpha)$%点の関係は次のようになります。

信頼度($\alpha$) 両側$100(1-\alpha)$%点 ($k$)
99% 2.58
95% 1.96
90% 1.65

つまり、信頼区間の信頼度が99%の時の$k$の値は2.58となるので区間推定の式は

\begin{eqnarray*}
\bar{X}-2.58\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+2.58\frac{\sigma}{\sqrt{n}}
\end{eqnarray*}

信頼度が95%の時の$k$の値は1.96なので

\begin{eqnarray*}
\bar{X}-1.96\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+1.96\frac{\sigma}{\sqrt{n}}
\end{eqnarray*}

となります。範囲が広い方が推定した値が当たる確率が高いということですね。

区間推定の例

あなたがお見合いパーティーに出席して、女性出席者100人(母集団)の平均年齢を推定することにします。ただし、次のことを前提とします。

  • 母集団の分布は正規分布
  • 母分散(母標準偏差)の値はわかっている($\sigma=4.29$とします)
  • 信頼度95%($k=1.96$)
  • 出席者20人とお話して相手の平均年齢は31歳

 

区間推定の式は

\begin{eqnarray*}
\bar{X}-k\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+k\frac{\sigma}{\sqrt{n}}
\end{eqnarray*}

となるので、以上の内容を区間推定の式に当てはめると次のようになります。

\begin{eqnarray*}
31-1.96\frac{4.29}{\sqrt{100}} \leq &\mu& \leq 31+1.96\frac{4.29}{\sqrt{100}} \\
\\
\therefore 30.16 \leq &\mu& \leq 31.84
\end{eqnarray*}

となり出席者の平均年齢は30.16~31.84歳ということになります。

 

区間推定の式の解説

区間推定の式(1)で示した内容をもう少し説明します。

標準正規分布で信頼区間95%を前提とした場合をグラフで表すと次のようになります。

母平均が$\mu$、標本抽出した際の標準偏差は$\frac{\sigma}{\sqrt{n}}$となるので次のように表せます。

\begin{eqnarray*}
\mu-1.96\frac{\sigma}{\sqrt{n}} \leq \bar{X} \leq \mu+1.96\frac{\sigma}{\sqrt{n}}
\end{eqnarray*}

この式を書き直すと次のようになります。

\begin{eqnarray*}
\bar{X}-1.96\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+1.96\frac{\sigma}{\sqrt{n}}
\end{eqnarray*}

式(1)と同じ式が導けました。

統計

Posted by Bright_Noah