僕にとってはこのあたりからが難関。
## Sec1
推定 (estimation)
点推定: 1 つの値によって母数を推定する
区間推定: 母数がある区間に含まれると推定する
検定 (statistical test)
推定量 (estimator)
母数点推定のために用いられる標本統計量
推定値 (estimate)
実際のデータから計算される推定量の値
不偏推定量
推定量の期待値が母数の値に一致する場合、その推定量は不偏推定量と呼ばれる。
最尤推定法・最尤法 (maximum likelihood method)
ある実際のデータが、母数がいくつの時に最も得られやすいかを調べ、実際に得られたデータの生起確率を最大とする母数の値を推定する方法
尤度関数
データの生起確率を母数の関数として表現したもの
尤度
特定の母数値に対する尤度関数の値
最尤推定量は常に不偏性を持つわけではない。
最尤法は、完全に母集団分布に異存した確率論的な方法。
回帰直線の推定に用いる最小二乗法は、特定の母集団分布に異存せずに推定量を導く方法。
標本誤差
実際の推定値と母数の値の差
標本誤差を評価する為には母数の値が必須だが、母数の値は不明な事が殆ど。なので、標本抽出にともなって推定量が母数の周辺をどの程度変動するかを考える。
標準誤差
推定量の標本分布の標準偏差の事。母集団比率 $π$の推定量としての標本比率 $p$ の標準誤差は以下の式
\[
σ_{p} = \sqrt{\frac{π (1-π)}{N}}
\]
になる。未知の値である $π$ をデータから得られる推定量 $p$ で置き換えれば、標準誤差の推定値
\[
\hat{σ_{p}} = \sqrt{\frac{p (1-p)}{N}}
\]
を得る。
母集団平均 $μ$ の推定量である標本平均 $\overline{x}$ の標準誤差は
\[
σ_{x} = \frac{σ}{\sqrt{N}}
\]
であるので、母集団標準偏差 $σ$ をデータから得られる不偏分散の平方根 $s'$ で置き換えれば
\[
\hat{σ_{x}} = \frac{s'}{\sqrt{N}}
\]
となり、標準誤差の推定値になる。
同様に母集団相関係数 $ρ$ の推定量 $r$ は、データから得られる相関係数 $r$ を利用して
\[
\hat{σ_{}} = \frac{1-r^{2}}{\sqrt{N}}
\]
となる。
## Sec2
無相関仮説
母集団相関係数がゼロであるとという仮説
帰無仮説 (null hypothesis)
検定用の仮説で、棄却される事を望まれる仮説の事。帰無仮説は $H_{0}$ と表記され、それが無相関仮説の場合 $H_{0}:ρ=0$ の様に表現する。
最も単純な検定として、無相関仮説を棄却可能な程度のデータが得られているかを確認する検定がある。
検定統計量
帰無仮説の検定に用いられる統計量。例えば母集団相関係数がゼロの時に標本相関係数の標本分布がどういう確率でどういう値を取るか、など。
帰無分布
帰無仮説のもとでの検定統計量の分布。
棄却域
帰無仮説と整合的でないとされる検定統計量の値の範囲。棄却域の端点を棄却の限界値と言う。
統計的に有意 (statistically significicant)
検定統計量の値が棄却域に入り、帰無仮説が棄却される時にその検定統計量は「有意である」と言う。
仮説検定
検定の対象が仮説になる検定の手法。
標本相関係数が有意かどうかテストする場合は、標本相関係数の有意性検定 (significance test) と言ったりする。
両側検定
棄却域を分布の両側に設定する検定方式。分布の片側のみに設定する場合は片側検定と言う。
有意水準 (significance level)
帰無仮説のもとではまれにしか生じない事象。よく 5% という基準値が利用される。
$p$ 値
得られた結果が有意となる有意水準の事。限界水準や有意確率とも呼ばれる。
$t$ 分布
データのモデルに正規分布を用いた場合にさまざまな統計量の標本分布と関係を持つ分布
標本関係係数 $r$ を
\[
t = \frac{r}{\sqrt{1-r^2}} \times \sqrt{N-2}
\]
によって変換した変数 $t$ が、その帰無仮説のもとで自由度 $N-2$ の $t$ 分布に従う事が知られている。上式から標本数 $N$ が大きくなると 相関係数 $r$ が小さくても統計的に有意になる事が分かる (t が大きくなる)。
検定力 (power)
母集団に於いてゼロで無い相関があるとき、サンプルに於いて有意な結果が得られる確率の事。検出力とも言われる。
第一種の誤り (type I error)
帰無仮説が正しい時に、それを棄却してしまう誤り。
第二種の誤り (type II error)
帰無仮説が正しく無い時に、そを採択してしまう誤り。
検定力分析 (power analysis)
検定力計算を用いて一定の検定力を確保する標本数を決める手続き。
## Sec4
信頼水準 (confidence level)、信頼係数
区間推定に於いてあらかじめ定められた確率で母数を含む区間を考えた時の、「あらかじめ定められた確率」の事。
信頼区間 (confidence interval)
信頼水準で母数を含むと推定される区間。
0 件のコメント:
コメントを投稿