chevron_left

メインカテゴリーを選択しなおす

cancel
My Interests https://ds.machijun.net

統計検定1級合格者です。 統計学とかRとかの興味あるネタを書いていきます。 入門・演習数理統計の全問題の解答や、明解演習数理統計で気づいた点などを書いています。

machijun
フォロー
住所
未設定
出身
未設定
ブログ村参加

2019/05/20

arrow_drop_down
  • サンプル分位数の漸近正規性を確かめる

    サンプル分位数の漸近正規性 サンプル分位数の漸近正規性で示した通り次が成り立ちます. $0 < p < 1$とし, 確率分布関数$F$が密度関数$f$を$Q_p$の近傍で持ち, $f$が$Q_p$で正であり連続ならば, \begin{align} \hat{Q}_{pn} \xrightarrow{d} \mathrm{N}\left(Q_p,\frac{p(1-p)}{f(Q_p)^2n}\right) \end{align} となる. 今回は, この定理が本当に成り立っているのかRを使ってシミュレーションしていきましょう. シミュレーション $F$が正規分布の場合 $F$を$\mathrm{N}(50,10^2)$に従う場合でシミュレーションしてみます. $n= 100 , p = 0.3$とします. この場合, $Q_p \fallingdotseq 44.756 , f(Q_p) \fallingdotseq 0.03477$なので, \begin{align} \hat{Q}_{0.3} \xrightarrow{d} \mathrm{N}\left(44.756,1.737\right) \end{align} となるはずです.シミュレーションにより$\hat{Q}_p$を独立に$10000$個生成し上記の正規分布に従うか確認してみます. Rのコードは次のようになります. 実行結果: 黒線がシミュレーションで生成した$\hat{Q}_p$で赤線が収束先の分布, つまり$\mathrm{N}\left(44.756,1.737\right)$です. よく一致していることがわかります. $F$がカイ二乗分布の場合 $F$を$\chi^2(8)$に従う場合でシミュレーションしてみます. $n= 200 , p = 0.7$とします. この場合, $Q_p \fallingdotseq 9.524 , f(Q_p) \fallingdotseq 0.0769$なので, \begin{align} \hat{Q}_{0.7} \xrightarrow{d} \mathrm{N}\left(9.524,0.1775\right) \end{align} となるはずです.シミュレーションにより$\hat{Q}

  • サンプル分位数の漸近正規性

    はじめに ここでは, サンプル分位数の漸近正規性を示します. 必要な定義なども触れながら示していきますので, 一応このページだけ見ればわかるようにしています. 本ページで示すサンプル分位数の漸近正規性をRでシミュレーションした結果はこちらのページです。 分位数 $F$を分布関数とします. 分布関数の定義より右連続です. $0 < p < 1$となる$p$に対して, $F$の$p$分位数($p$-th quantile or fractile of $F$)は, \begin{align} Q_p = \inf \left\{x ; F(x) \ge p \right\} \end{align} で定義されます.これは, \begin{align} F(Q_p -) \le p \le F(Q_p) \end{align} を満たします.なお, 分位数は分位点または分位値ともいいます. 通常の意味での逆関数とは異なりますが, 次のような$F^{-1}$を定義することができます. \begin{align} F^{-1}(p) = \inf \{Q_p;F(Q_n) \ge p \} \end{align} これは$p$分位数の定義と同じことを言っています. 補題.$F$を分布関数とする. 上記で定義される$F^{-1}(p)$は, 非減少かつ 左連続で次を満たす. \begin{align} &\text{(i)} F^{-1}(F(x)) \le x ,\qquad -\infty < x < \infty\lnl &\text{(ii)} F(F^{-1}(p)) \ge p , \qquad 0 < p < 1\label{l-2}\lnl &\text{(iii)} F(x) \ge p \Longleftrightarrow x \ge F^{-1}(p) \end{align} 標本分布関数 分布$F$に従う大きさ$n$の標本$\{X_1 , X_2,\cdots ,X_n \}$を考えます.この標本に対しての標本分布関数(sample distribution function)とは, \begin{align} &F_n(x) = \frac{1}{n}\sum_{i=1}^n I(X_i \le x) ,\qquad -\infty < x

  • 統計検定1級に合格しました(午前午後同時合格者数は?)

    午前と午後を同時に受かっている人はどれぐらいいるのでしょうか。

  • WordPressで数式を表示しよう(MathJax)

    WordPressで数式を表示しよう このブログのように、理系ネタが多いブログでは数式の表示が必須です。 今回はWordPressで数式を表現する方法、とりわけMathJaxについて紹介します。 数式の表現の方法とメリット・デメリット 数式の表現の方法としては、 がんばって文字で表現する LaTeXで数式を作り画像を張り付ける LaTeXでPDFを作りファイルをダウンロードしてもらう QuickLaTeXを使ってTeX数式を画像に変換する MathJaxを使ってTeX数式を変換する などなど、いろいろあります。 ①については、論外です。 例えば、2次方程式の解の公式 \begin{align}x = \frac{-b\pm \sqrt{b^2-4ac}}{2a}\end{align} を文字だけで表現しようとすると次のようになります。 x = (-b ± √(b^2-4ac))/(2a) これ、書くほうもめんどくさいですし、見るほうもわかりにくいですよね。 数式の中身の理解に時間をとるべきで、表現の読み解きに時間を割くべきではないです。 ②については、量が多いと数式の作成・貼り付けなど手間がかかります。 加筆修正する際にも、再度画像を作成する必要があるなど、管理も大変です。 うちのブログのようなほとんど数式みたいなところには向きません。 ③はよくある選択だと思います。 ただ、数式を表現したいだけなのに全体をLaTeX(PDF)にするのはいかがなものでしょうか。 ページの表現はWordPressのようなCMSを使ってうまくやりたいですよね。 PDFファイルの中身はWordPressの検索にヒットしません。 また、これも加筆修正の際にTeXソースを探してきて、修正して、PDF化して、アップロードして、と手間がかかります。 これだけ手間だと、ちょっとした間違いだと放置しちゃいがちになっちゃいますよね。 ④当サイトはもともとこれでした。 理由は、WordPress上で編集できて、結果をすぐに見れるからです。 またMathJaxの描画の遅さが気になって、画像化できているほうが早いだろうという目論見があったからです。 しかし、使っているうちに、 キャッシュがないときの画像生成がめちゃくちゃ遅い 日本語が使えない 画像が荒いことがある

  • 有名不等式(シュワルツの不等式)

    イントロ 統計検定(1級)でもたまに知識が必要な有名不等式をまとめます。 今回は、シュワルツの不等式について紹介します。 いろいろなシュワルツの不等式 シュワルツの不等式はいろいろな形であらわれます。 ここでは4つの形を紹介します。 シュワルツの不等式(2数列バージョン) 2数列に関するシュワルツの不等式を紹介します。一番ポピュラーなものです。 シュワルツの不等式(2数列バージョン) 正の整数$n$に対し、実数列$\{a_i\} , \{b_i\} , i=1,2,\cdots,n$をとる。そのとき次の不等式が常に成立する。 \begin{align} \left(\sum_{i=1}^{n} a_i b_i \right)^2 \le \left(\sum_{i=1}^{n} {a_i}^2\right)\left(\sum_{i=1}^{n} {b_i}^2\right) \end{align} 等号成立は \begin{align} a_1:a_2:\cdots:a_n = b_1:b_2:\cdots:b_n \end{align} の場合に限る。 コーシー・シュワルツの不等式とも言ったりします。 証明 $t$を実変数、$1 \le i \le n$とすると、 \begin{align}(a_i - t b_i)^2 \ge 0\label{ineq-a}\end{align} が成り立つ。 左辺を展開して$i=1$から$i=n$まで辺々足すと、 \begin{align} \sum_{i=1}^{n} {a_i}^2 -2t\sum_{i=1}^n a_i b_i + t^2 \sum_{i=1}^{n} {b_i}^2 \ge 0 \end{align} 左辺を$t$に関する二次関数とみると、常に0以上(実数解を持たない、または重解を1個持つ)であるので、判別式$D$は0以下となる。 つまり、 \begin{align} \frac{D}{4} = \left(\sum_{i=1}^n a_i b_i\right)^2 - \left(\sum_{i=1}^{n} {a_i}^2\right)\left(\sum_{i=1}^{n} {b_i}^2\right) \le 0 \end{align}

  • 2018統計検定1級受験記

    2018年11月25日 統計検定1級を受けてきました。試験の様子と感想を書きます。

  • 数理統計:連続一様分布の性質

    イントロ 代表的な分布の性質を解説します。 今回は連続一様分布です。 定義 連続一様分布は2つのパラメータ$a,b$をとり、区間$(a,b)$で確率密度関数が一定値を取るような分布です。 この連続一様分布を$U(a,b)$と書いたりします。 確率密度関数は、$X \sim U(a,b)$として、 \begin{align} f_X(x) = \begin{cases} \cfrac{1}{b-a} & (a < x < b) \lnl 0&(\text{その他}) \end{cases} \end{align} と表されます。 期待値 定義通りに計算します。 \begin{align} E(X) &= \int_a^b x\cdot \cfrac{1}{b-a} \delt x\lnl &=\frac{1}{b-a}\left[\frac{1}{2}x^2\right]_a^b\lnl &=\frac{a+b}{2} \end{align} 分散 $V(X)=E(X^2) - E(X)^2$を用いて計算します。 \begin{align} E(X^2) &= \int_a^b x^2\cdot \cfrac{1}{b-a} \delt x\lnl &=\frac{1}{b-a}\left[\frac{1}{3}x^3\right]_a^b\lnl &=\frac{a^2+b^2+ab}{3} \end{align} これから、 \begin{align} V(X) &= E(X^2) - E(X)^2\lnl &= \cfrac{a^2+b^2+ab}{3} - \left(\cfrac{a+b}{2}\right)^2\lnl &= \cfrac{(b-a)^2}{12} \end{align} 積率母関数 定義通りに計算します。 \begin{align} M_X(t) &= E\left(e^{tX}\right) \lnl &= \int_a^b e^{tx}\cdot \cfrac{1}{b-a} \delt x\lnl &=\cfrac{1}{b-a}\left[\frac{e^{tx}}{t}\right]_a^b\lnl &=\cfrac{e^{tb}-e^{ta}}{t(b-a)} \end{align}

  • 数理統計:指数分布の性質

    イントロ 代表的な分布の性質を解説します。 今回は指数分布です。 定義 指数分布はパラメータ$\beta$をとります。 この指数分布を$Ex(\beta)$と書いたりします。 確率密度関数は、$X \sim Ex(\beta)$として、 \begin{align} f_X(x) = \begin{cases}\beta e^{-\beta x}& x >0\\ 0&x \le 0 \end{cases} \end{align} と表されます。 形からわかるように、ガンマ分布$Ga(\alpha,\beta)$の$\alpha=1$の場合と考えることができます。 期待値 定義通りに計算します。 \begin{align} E(X) &= \int_0^\infty x\cdot \beta e^{-\beta x} \mathrm{d}x\\ &= \int_0^\infty e^{-\beta x} \mathrm{d}x - \Bigl[xe^{-\beta x}\Bigr]_0^\infty\\ &=\left[-\frac{1}{\beta}e^{-\beta x}\right]_0^\infty\\ &= \cfrac{1}{\beta} \end{align} 分散 $V(X)=E(X^2) - E(X)^2$を用いて計算します。 \begin{align} E(X^2) &= \int_0^\infty x^2 \cdot \beta e^{-\beta x} \mathrm{d}x\\ &= 2 \int_0^\infty x\cdot e^{-\beta x} \mathrm{d}x - \Bigl[x^2 e^{-\beta x}\Bigr]_0^\infty\\ &= \cfrac{2}{\beta^2} \end{align} これから、 \begin{align} V(X) &= E(X^2) - E(X)^2\\ &= \cfrac{2}{\beta^2} - \left(\cfrac{1}{\beta}\right)^2\\ &= \frac{1}{\beta^2} \end{align} 積率母関数 定義通りに計算します。 \begin{align} M_X(t) &= E\left(e^{tX}\right) \\ &= \int

  • 数理統計:ガンマ分布の性質

    イントロ 代表的な分布の性質を解説します。 今回はガンマ分布です。 定義 ガンマ分布は2つのパラメータ$\alpha,\beta$をとります。 このガンマ分布を$Ga(\alpha,\beta)$と書いたりします。 確率密度関数は、$X \sim Ga(\alpha,\beta)$として、 \begin{align} f_X(x) = \begin{cases}\cfrac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}& x >0\\ 0&x \le 0 \end{cases} \end{align} と表されます。 期待値 定義通りに計算します。 \begin{align} E(X) &= \int_0^\infty x\cdot \cfrac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} \mathrm{d}x\\ &= \int_0^\infty \cfrac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha}e^{-\beta x} \mathrm{d}x\\ &= \cfrac{\alpha}{\beta} \underline{ \int_0^\infty \cfrac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} \mathrm{d}x} - \left[\frac{\beta^{\alpha-1}}{\Gamma(\alpha)}x^\alpha e^{-\beta x}\right]_0^\infty\\ &= \cfrac{\alpha}{\beta} \end{align} 最後の式の変形は、下線部が$Ga(\alpha,\beta)$のガンマ分布の全確率$1$となることを利用しました。 分散 $V(X)=E(X^2) - E(X)^2$を用いて計算します。 \begin{align} E\left(X^2\right) &= \int_0^\infty x^2\cdot \cfrac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} \mathrm{d}x\\ &=

  • 数理統計:正規分布の性質

    イントロ 代表的な分布の性質を解説します。 今回は正規分布です。 定義 正規分布は2つのパラメータ$\mu,\sigma^2$をとります。 この正規分布を$N(\mu,\sigma^2)$と書いたりします。 確率密度関数は、$X \sim N(\mu,\sigma^2)$として、 \begin{align} f_X(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \end{align} と表されます。 期待値 定義通りに計算します。 \begin{align} E(X) &= \int_{-\infty}^{\infty} x\cdot \frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \mathrm{d}x\\ &(\text{Put } t \text{ as } x-\mu)\\ &=\int_{-\infty}^{\infty} \frac{t + \mu}{\sqrt{2\pi}\sigma}\exp\left(-\frac{t^2}{2\sigma^2}\right) \mathrm{d}t\\ &=\int_{-\infty}^{\infty} \frac{t + \mu}{\sqrt{2\pi}\sigma}\exp\left(-\frac{t^2}{2\sigma^2}\right) \mathrm{d}t\\ &=\left[-\frac{\sigma}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2\sigma^2}\right)\right]_{-\infty}^{\infty}\\ &\qquad + \mu \underline{\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{t^2}{2\sigma^2}\right) \mathrm{d}t}\\ &=\mu \end{align} 最後の式の変形は、下線部が$N(0,\sigma^2)$の二項分布の全確率$1$となることを利用しました。 分散 $V(X)=E(X^2)

arrow_drop_down

ブログリーダー」を活用して、machijunさんをフォローしませんか?

ハンドル名
machijunさん
ブログタイトル
My Interests
フォロー
My Interests

にほんブログ村 カテゴリー一覧

商用