AWS認定資格の全体像と目的別おすすめ受験順を解説。CLF・AIF・SAA・MLA・AIP-C01など各資格の難易度・勉強方法記事へのリンクをまとめています。
|
|
https://x.com/zawato7 |
|---|
【2026年最新】AWS認定資格の種類と取得ロードマップ 目的別おすすめ受験順を解説
AWS認定資格の全体像と目的別おすすめ受験順を解説。CLF・AIF・SAA・MLA・AIP-C01など各資格の難易度・勉強方法記事へのリンクをまとめています。
Claude CodeにGmail・Googleカレンダーを接続する方法【MCP】【VSCode】
Claude Codeから「昨日届いたメールをまとめて」「来週の会議を追加して」と話しかけるだけでGmailとGoogleカレンダーを操作できる。そんな環境をMCP(Model Context Protocol)で実現する手順を解説する。本...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問14【解答例・解説】
解説(1)図1はモデル1(\(y = \beta_0 + \beta_1 x + \varepsilon\))の回帰診断図である。表より、USA(アメリカ合衆国)の実際の平均寿命 \(y\) は 78.8 である。図1の「(ア) Resid...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問13【解答例・解説】
解説1. 最初のクラスター形成最近隣法、最遠隣法のどちらの手法を用いても、最も距離が近い 2 点が最初に結合する。表 2 の距離行列を見ると、最小の距離は個体 4 と 5 の間の \(\sqrt{2}\) である。よって、最初に形成されるク...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問12【解答例・解説】
解説\(\overline{X^*}\) の値を確認する。表の一番右の列に、10回の繰り返しによって得られた各ブートストラップ標本の平均値 \(\overline{X^*}\) が記載されている。具体的な値は以下の 10 個である。5.1,...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問11【解答例・解説】
解説出発時の傘の本数 \(X_n\) が、次の出発時 \(X_{n+1}\) にどう変化するかを調べる。状態空間は \(\{0, 1, 2\}\) であるため、それぞれの場合について場合分けを行う。① \(X_n = 0\) の場合(出発地...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問10【解答例・解説】
解説(1)独立性を仮定した場合、各セルの期待度数は以下の式で求められる。\表の周辺度数(計の欄)から、以下の数値が読み取れる。女性の合計人数:39 人就業者の合計人数:68 人全体の合計人数:80 人これを式に当てはめると、女性の就業者の期...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問9【解答例・解説】
解説(ア)について:誤り有限母集団から「母集団の半分の大きさの標本」を抽出する、すなわち \(n = \frac{N}{2}\) の場合を考える。問題文の冒頭で与えられている標本平均の分散の公式にこれを代入すると、以下のようになる。\計算結...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問8【解答例・解説】
解説1. 1次の標本自己相関係数 \(\hat{\rho}\) の算出自己相関係数 \(\hat{\rho}\) は、「共分散を分散で割る」ことで求められる。問題文で与えられている残差系列の分散と共分散を用いて計算する。\この結果から、残差...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問7【解答例・解説】
解説①・② 誤り1元配置と2元配置では、上述の通り残差平方和の構成が変わるため、残差分散の大きさは異なる。それに伴い、検定統計量である \(F\) 値も変わるため、「どちらの解析法でもよい」とは言えない。③ 誤り実験条件 \(A\) の平方...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問6【解答例・解説】
解説1. 必要な数値の確認問題文の表から、以下の数値を読み取る。有効回答数(標本サイズ):\(n = 857\)イチロー選手が好きだと回答した割合(標本比率):\(\hat{p} = 0.224\)2. 95%信頼区間の公式標本サイズが十分...
【統計検定準1級】2017年6月 選択問題及び部分記述問題 問5【解答例・解説】
解説まずは、問題文から与えられている前提条件を整理する。兄の身長を \(X\)、弟の身長を \(Y\) とする。\(X\) の期待値 \(\mu_X = 140\)、分散 \(\sigma_X^2 = 15^2\)\(Y\) の期待値 \(...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問8
解説確率変数 \(T\) が \(t\) 以下となる確率を表す累積分布関数 \(F(t)\) は、全確率 1 から生存関数 \(S(t)\) を引くことで求められる。\\確率密度関数 \(f(t)\) は、累積分布関数 \(F(t)\) を...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問7
解説フィッシャーの3原則反復(Replication) 同じ処理(今回であれば同じ肥料)を、複数の異なる実験対象(苗)に対して行うこと。これにより、偶然生じるばらつき(偶然誤差)の大きさを評価・推定できるようになり、実験の精度が高まる。無作...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問6
解説自由度調整済み決定係数(\(\bar{R}^2\))は、説明変数の数が多いほど決定係数(\(R^2\))が大きくなりやすいという性質を補正した指標である。以下の公式で計算できる。\ここで、\(n\) はサンプルサイズ、\(k\) は説明...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問5
解説帰無仮説 \(H_0\) が正しいと仮定すると、母比率 \(p = 0.4\) である。このとき、標本比率 \(\hat{p}\) の平均と分散は以下のようになる。平均:\(E(\hat{p}) = p = 0.4\)分散:\(V(\h...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問4
解説1. 用いるべき分布の確認正規分布に従う母集団から抽出された標本において、標本平均からの偏差平方和を \(T^2\)、標本サイズを \(n\)、母分散を \(\sigma^2\) とすると、統計量 \(\frac{T^2}{\sigma...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問3
解説1. 期待度数の計算1週間の合計問い合わせ回数は 42 回であり、曜日は 7 日間ある。どの曜日も均等に問い合わせが来ると仮定すると、1日あたりの期待度数 \(E\) は以下のようになる。\つまり、帰無仮説のもとでは毎日 6 回ずつ問い...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問2
解説サイコロの目 1, 2, 3, 4 が出る確率を、それぞれ \(p_1, p_2, p_3, p_4\) とおく。問題文の条件「\(P(X=1) = P(X=3)\)」「\(P(X=2) = P(X=4)\)」より、以下が成り立つ。\\...
【統計検定準1級】2016年6月 選択問題及び部分記述問題 問1
解説変動係数は、データの散らばり具合を相対的に評価するための指標であり、以下の公式で求められる。\餌を替える前の平均値は 55 kg、標準偏差は 11 kgであるから、\従って、餌を替える前の体重の変動係数は 0.2 である。餌を替えて飼育...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問13
解説目標分布は、2つの正規分布の混合分布である。与えられた目標分布の確率密度関数 \(\pi(x)\) は、標準正規分布 \(N(0, 1)\) と、平均 6、分散 1 の正規分布 \(N(6, 1)\) を 1:3 の割合で足し合わせたも...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問12
解説図1の原系列(現金給与総額の時系列プロット)を見ると、1年(12ヶ月)ごとの強い周期性が確認できる。また、夏と冬の年2回支給されるボーナスの影響により、半年(6ヶ月)ごとの周期も明確に観察される。自己相関関数(ACF)をグラフ化したコレ...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問11
解説バリマックス回転のような直交回転を用いた場合、各項目(変数)の「共通性」は、各因子の「因子負荷量の2乗和」となる。公式の解説に倣い、表の共通性の値を小数第2位で丸めて(\(0.9412 \to 0.94\)、\(0.8762 \to 0...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問10
解説1. スパース性を持つ手法の特定4つの手法のうち、予測に不要な変数の係数を完全に 0 にする「スパース性」を持つのは、\(L_1\)正則化法(Lasso)とOLS法+AIC(変数減少法)の2つである。グラフを見ると、多数のパラメータが ...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問9
解説クロス集計表の各セルの観測度数(頻度)を \(O_{ij}\) 、期待度数を \(E_{ij}\) とする。すべての頻度を \(a\) 倍(\(a=2, 3, \dots\))にすると、全体の標本サイズ \(n\) も \(a\) 倍に...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問8
解説1次自己回帰モデル(AR(1)モデル)は、現在の値が1時点前の値にのみ直接依存するモデルである。AR(1)モデルにおける自己相関関数 (ACF) は、ラグ(時間差)が大きくなるにつれて指数関数的に減衰していくという特徴を持つ。一方、偏自...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問7
解説階層的クラスター分析のウォード法は、「クラスターを結合した際に、情報量の損失(データのばらつき)がなるべく小さくなるように結合していく」手法である。このばらつきの指標として「偏差平方和」を用いる。クラスター間の距離は、「結合後のクラスタ...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問6
解説偏差値は、得点が平均からどれだけ離れているかを標準偏差を基準にして表した指標であり、以下の式で計算できる。\文系のAさん(得点 64 点)の偏差値文系の集団(平均 65、標準偏差 5)における偏差値を計算する。\理系のBさん(得点 86...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問5
解説まず、A薬群とB薬群のすべてのデータをまとめ、値が小さい順(血圧が低い順)に順位をつける。提供されたデータは以下の通りである。A薬:135, 127, 131B薬:132, 144, 138これらを小さい順に並べ替えると、次のようになる...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問4
解説クロス集計表のデータから、正しいモザイクプロットを選ぶ問題である。モザイクプロットは、四角形の面積で各カテゴリの度数(または割合)を表現したグラフである。縦と横の分割の比率に注目して絞り込んでいく。1. 縦方向の分割(男女の割合)グラフ...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問3
解説データの判別境界を数学的に表現すると、以下の判別関数 \(r(x)\) で完全に分類できる。\カーネルによる構成4 次の多項式カーネルを用いれば、適切な係数 \(a_i\) を選ぶことで、上記の 4 次式 \(r(x)\) を構成できる...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問2
解説\(X_i\) は 0 または 1 の値しか取らないため、\(X_i^2 = X_i\) が常に成り立つ(\(1^2=1, 0^2=0\) であるため)。よって、期待値の線形性より以下のようになる。\ = E\]期待値の定義(値 \(\...
【統計検定準1級】2018年6月 選択問題及び部分記述問題 問1
解説1. 検査1で陽性が出る確率 \(P(T_1)\) を求める陽性が出るのは、次の2つのパターンである。本当に感染していて、正しく陽性と判定される場合\感染していないのに、誤って陽性と判定される場合\従って、検査1で陽性が出る全体の確率は...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問12
解説1. 特性方程式を立てる問題文にある通り、\(AR(p)\) モデルが定常であるための必要十分条件は、特性方程式:\のすべての解(根)の絶対値が1より大きいことである。今回の条件 \(a_1 = a_2 = a\) を代入すると、方程式...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問11
解説1. データの整理問題文の条件より、各状態間での企業数の移動は以下の通りである。状態A(100社)からの推移\(A \to B\) に推移した企業:5 社変化なし(\(A \to A\)):100 - 5 = 95 社状態B(20社)か...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問10
解説データ \(y_i\) は「破損あり(1)」または「破損なし(0)」の 2 値をとる変数である。このように、1回の試行で成功か失敗かのいずれか一方が起こる確率分布をベルヌーイ分布と呼ぶ。 数式では \(Bin(1, \pi_i)\) と...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問6
解説主成分分析において、各主成分がデータ全体の変動をどの程度説明しているかを示す指標が「寄与率」である。累積寄与率は、第1主成分から順に寄与率を加算していくことで求められる。表の「寄与率」の行から順に加算を行う。第1主成分 (PC1):0....
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問5
解説1. 調査手法この調査は、先に「病気の有無」でグループ分けし、後から「過去の習慣(喫煙)」を調べている。これを症例対照研究(ケース・コントロール研究)と呼ぶ。調査対象(分母)を研究者が決めているため、表の数字から直接「喫煙者の罹患率(病...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問4
解説帰無仮説「CMの影響の有無と購入の有無に関連がない」の下で、「CMの影響あり」かつ「購入あり」のセルの期待度数を求める。期待値は、全体の人数にそれぞれの周辺確率を掛けることで求められる。\カイ二乗(\(\chi^2\))統計量は、すべて...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問3
解説(1)1. 標準誤差(SE)の算出標本サイズ \(n = 475\)、帰無仮説における比率 \(p_0 = 0.05\) である。\(\hat{p}\) の標準偏差(標準誤差)は以下の式で求められる。\2. 検定統計量 \(Z\) の算...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問2
解説3種類のカードを A, B, C とし、これらをすべて揃えるまでの購入回数の期待値を求める。1種類目を入手するまでまだ何も持っていない状態から、どのカードでも良いので1枚目を入手する確率は \(p_1 = \frac{3}{3} = 1...
【統計検定準1級】2019年6月 選択問題及び部分記述問題 問1
解説ポアソン分布の和の性質独立なポアソン分布の和もまた、ポアソン分布に従う。これをポアソン分布の再生性と呼ぶ。\(X \sim \text{Po}(\lambda_1)\)、\(Y \sim \text{Po}(\lambda_2)\) の...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問12
解説まず、ピアソンの相関係数 \(R\) を用いた検定統計量の性質を考える。一般に、サンプルサイズ \(n\) のデータにおいて、母相関係数が 0 であるという帰無仮説のもとでは、以下の統計量 \(t\) は自由度 \(n-2\) の \(...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問11
解説表に示された「1」「2」「7」の主成分得点(PC1, PC2)を座標として、散布図上の位置を確認する。「1」のデータ\これらは PC1が約 -7 前後、PC2が 0 付近に集中している。散布図の左端(中央付近)に位置するはずである。「2...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問10
解説与えられたモデルは \(y_t = \epsilon_t + 0.8\epsilon_{t-1}\) である。◼︎コレログラム \(\rho(h)\)MA(1) モデル \(y_t = \epsilon_t + b_1\epsilon_...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問9
解説まず、A群(不真面目な回答者)とB群(真面目な回答者)のデータが統計的にどう現れるかを考える。1. スクリープロットの判別A群:ほとんど同じ回答カテゴリーばかり選ぶため、全項目間に非常に強い正の相関が生じる。その結果、第1主成分(第1因...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問8
解説臨床試験において、新薬(降圧薬A)の効果を検証する場合、「新薬がプラセボ(偽薬)よりも優れていること」を証明するのが目的である。帰無仮説 \(H_0\):新薬とプラセボに差がない(=効果がない)対立仮説 \(H_1\):新薬の方がプラセ...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問7
解説線形回帰モデルにおいて、誤差項 \(\epsilon_t\) が独立に平均 0、分散 \(\sigma^2\) の正規分布 \(N(0, \sigma^2)\) に従うとき、観測値 \(y_t\) は以下の正規分布に従う。\正規分布の密...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問6
解説1変量の統計学において、全変動 = 群内変動 + 群間変動 という関係(分散分析の基本)が成り立つ。これの多変量版が、分散共分散行列においても成立する。\(S\)(全分散共分散行列): 全データ $z_i$ が平均 $\bar{z}$ ...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問5
解説最小二乗法(OLS): すべてのデータを平等に扱う。不均一分散下でも「不偏性(偏りがないこと)」は保たれるが、推定量の分散は最小にならない。一般化最小二乗法(GLS/WLS): 分散 \(\sigma_i^2\) の逆数を重みとして用い...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問4
解説最小二乗法では、残差平方和 \(Q(b) = (\boldsymbol{y} - b\boldsymbol{x})^T(\boldsymbol{y} - b\boldsymbol{x})\) を最小にする \(b\) を求める。これを ...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問3
解説与えられた3変数正規分布 \(N(\boldsymbol{\mu}, \Sigma)\) のパラメータは以下の通りである。平均ベクトル\\(E=1, E=2, E=3\)分散共分散行列\\(V(X)=2, V(Y)=3, V(Z)=4\...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問2
解説連続型確率変数の期待値の定義より、\begin{eqnarray}E(X_i) &=& \int_0^\infty x^2 \cdot \frac{1}{\lambda}e^{-x/\lambda} dx \\&=& _0^\infty...
PandasでJupyterが落ちる原因!?ループ内のpd.concatを「リスト結合」に変えてメモリ不足を解消する方法
「Jupyter Notebookで大量のデータを結合していたら、突然カーネルが死んだ(Dead Kernel)……」データ分析の現場でよくある光景ですが、その原因の多くはマシンスペック不足ではなく、Pandasの書き方(アンチパターン)に...
【統計検定準1級】2021年6月 選択問題及び部分記述問題 問1
解説\begin{eqnarray}P(A\cup B) &=& P(A) + P(B) - P(A\cap B) \\&=& P(A) + P(B) - P(A B)P(B) \\\end{eqnarray}であり、与えられた値を代入する...
解説(1)モデル \(M_1\) は、フルモデルから因子 \(C\)(身体的ストレス)と因子 \(D\)(血圧)の関連を示す辺 \(CD\) を取り除いたモデルである。自由度各因子が 2 水準なので、0 とおいた 4 つのパラメータの自由度...
解説(1)\begin{eqnarray}Z^TZ &=& \begin{pmatrix} 1 & 1 & 1 & 1 & 1 \\ -2 & -1 & 0 & 1 & 2 \end{pmatrix} \begin{pmatrix} 1 &...
解説本実験は \(2^{4-1}\) 分割実施計画であり、因子 \(D\) を \(D = A \times B \times C\) として割り付けている。直交表 \(L_8(2^7)\) において、因子 \(A, B, C\) をそれぞ...
解説それ以前の事象の発生と独立、かつ、発生確率が極めて低い事象。ポアソン過程において、時間(ページ数) \(t\) までの発生回数の期待値は \(E = \lambda t\) である。つまり、累積発生回数は平均的に原点を通る直線(傾き \...
解説標本分散共分散行列より、国語の分散 \(V(X_{国語})\) は 428.6 であるから、国語と数学の相関係数は、\begin{eqnarray}r_{X_{国語},X_{数学}} &=& \frac{Conv(X_{国語},X_{数...
解説乱塊法では、制御したい因子 \(A\)(イネの品種)と因子 \(B\)(肥料)に加えて、場所の違いを ブロック因子 \(C\) として取り入れる。ブロック因子の効果を \(\gamma_k\) とすると、観測値 \(Y_{ijk}\) ...
解説プロビット・モデルは、ある事象が「起きるか・起きないか」という二値(\(Y=1\) または \(0\))を予測するモデルである。(1) 積雪確率の推定値平均気温 \(X_1 = 1\)、日照時間 \(X_2 = 1\) のときの積雪確率...
解説(1) 推定値の算出標準化された変数において、相関係数 \(r_{ij}\) と回帰係数の間には特定の関係がある。各方程式の両辺に \(X_i\) を掛けて期待値をとることで、以下の連立方程式が得られる。\(X_2\) の式より、\ =...
解説ベイズの定理を用いると、クラス \(y=1\) である事後確率は、\と書ける。ここで、各クラスの事前確率 \(\Pr(y=1) = \Pr(y=-1)\) と仮定すると、対数比は次のように整理される。\ここに二次元正規分布 \(N(\m...
解説グラフィカルモデルにおいて、変数のペア \((X_i, X_j)\) の間に辺(エッジ)がないことは、他のすべての変数を固定したときの条件付き独立性を意味する。ガウス型グラフィカルモデル(多変量正規分布を仮定したモデル)において、この条...
解説一元配置分散分析のモデル式は \(Y_{ij} = \mu + \alpha_i + \epsilon_{ij}\) である。ここで、各水準(品種)の期待値を \(\mu_i\) とすると、\(\mu_i = \mu + \alpha_...
解説欠測の有無(指標変数 \(H\))は、\(Y_1\) の値のみによって決まるため、\(Y_1\) の値が固定されていれば、その人が高血圧群かどうかの情報は \(Y_2\) の期待値に影響を与えない。これを数式で表すと以下のようになる。\...
解説(A)と(B)\(X=x_0\) が得られたときの二項分布の確率関数を \(p(X=x_0 n, \theta)\) とおくと、\よって、\(\theta\) の事後分布 \(f(\theta x_0)\) は、\begin{eqnar...
解説マルコフ性について、「現在の \(S_n\) の値さえ分かれば、過去の経緯は無視して未来を予測できるか?」を考えます。例えば、\(n=0\) で \(S_2=0\) とする。このとき、過去のルートによって以下の \(S_3\) の動きが...
解説(1)ポアソン分布は期待値と分散が一致する。分散は \((1.67)^2=2.7889\) となり、平均 2.84 とほぼ一致することから、ポアソン分布に従うのではないかと考えている。(2)パラメータ \(\lambda=2.84\) ...
解説対数オッズ比の 95 %信頼区間の求め方は、こちら!男性の場合、\であるから、\begin{eqnarray}\exp\left &=& \exp \\&=& (\exp(-1.686),\exp(2.050)) \\&=& (0.18...
解説被説明変数と説明変数を対数変換した場合、回帰係数は説明変数の変化率に対する被説明変数の変化率の比と解釈することができる。回帰モデルとしては、被説明変数と説明変数の対数変換は、大域的に弾性率一定であることを意味するから。自動調整済み決定係...
解説カードを引く段階で各数字 \(a_j\) が取り出される確率はすべて 1/4 である。【状態1のとき】\(a_1\) のカードを引いて状態1にとどまる確率は 1/4 である。\(a_j(j\neq 1)\)のカードを引いたとき状態 \(...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問16
解説(解答例)第 1 主成分の寄与率が 55.5%であるため、第 1 主成分だけでも半数を超える説明力があるといえる。主成分得点は、固有ベクトルの値と対応する変数の値を掛け、全て足し合わせることで求められる。第 1 主成分得点と第 2 主成...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問15
解説自由度調整済み決定係数 \(\bar{R}^2\) は 1 に近い方が良く、\(F\) 値に対する \(P\) 値は 0 に近い方が良い。従って、モデル 3 が選択される。モデル 3 の式は、\であるから、\\となる。
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問14
解説\(N\) 組の乱数のうち、\(U^2+V^2<1\) となる組の個数 \(M\) は、二項分布 \(B(N, \pi/4)\) に従う。\=N\frac{\pi}{4}\]\=N\frac{\pi}{4}(1-\frac{\pi}{4...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問13
解説一般に、ベータ分布は二項分布の共役事前分布であるから、\(n\) 回の思考で \(x\) 回成功した時の \(\theta\) の事後分布は、\begin{eqnarray}f(\theta x) &\propto& {}_nC_x...
2カテゴリ×2カテゴリのデータを扱う場面では、独立性検定(カイ二乗検定)とオッズ比(Odds Ratio, OR)がセットで登場します。しかし、それぞれが何を意味し、どのような役割を持っているのかは意外と混同されやすいところです。この記事で...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問12
解説\(m×n\) のクロス集計表の場合、自由度 \((m-1)×(n-1)\) のカイ二乗分布を用いて検定を行う。今回、ピアソンのカイ二乗統計量 \(\chi^2\) は、自由度\((2-1)×(2-1)=1\) のカイ二乗分布に従う。\...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問11
解説各列が直行するように 1 と 2 を割り当てる。ここで、各列において 1 が 4 つ、2 が 4 つになることに注意して割り当てる。実験ABCD1111121122312124122152112621217221182222I:誤り。直...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問10
解説\自己回帰係数 \(\alpha\) が大きな正の値であるほど、一つ前の状態に似た数値となりグラフの変化が穏やかな傾向を示す。従って、 \(\alpha=0.7\) のときは(B)と考えられる。また、 \(\alpha=0\) のときは...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問9
解説\より、\となる。\(x\) が大きくなるほど、 \(y\) は指数関数的な値を示すことがわかる。\(Y\) の条件付き期待値 \(E\) は、\begin{eqnarray}E&=&E \\&=&\exp(\alpha+\beta x...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問8
解説相関係数を求めるには、2つの確率変数 \(X,Y\) の共分散とそれぞれの標準偏差が分かれば良い(参考)。\={(V-V-V)}/2\]より、相関係数 \(\rho\) は、\2つの確率変数 \(X,Y\) の差の標準偏差を求めれば良い...
統計学の入門で最初に登場するのが、期待値・分散・標準偏差・共分散・相関係数などの指標です。これらはデータの特徴や変数間の関係をとらえる上で不可欠ですが、似た言葉が多く混乱しやすい分野でもあります。この記事では、それぞれの意味と公式をシンプル...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問7
解説帰無仮説 \(H_0:\mu=135\) に対して対立仮説 \(H_1:\mu<135\) の片側 \(t\) 検定を行う。\(t\) 統計量(\(t\) 検定で使う検定統計量)は、\となる。この \(t\) 統計量は、自由度9の \(...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問6
解説1回目のテストで点数が低かった学生ほど2回目に受験しない傾向にあったことから、 \(\bar{y}_A\) で \(\mu_Y\) を推定した場合、平均値はより大きい値になると考えられる。従って、 \(\bar{y}_A\) は \(\...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問5
解説主な抽出法◼︎単純無作為抽出法母集団のすべての要素から、同じ確率で無作為に抽出◼︎層別抽出法母集団を性別・年代などの「層」に分け、各層から無作為抽出◼︎集落抽出法(クラスター抽出法)1. 母集団をいくつかのグループ(クラスター)に分ける...
確率分布まとめ 期待値・分散・モーメント母関数の導出、定義や覚えておきたい性質を解説
離散型確率分布二項分布 \(B(n,p)\)二項分布とは、「独立なベルヌーイ試行を \(n\) 回行ったときの成功回数の分布」である。\◼︎期待値期待値の導出\begin{eqnarray}E &=& \sum_{k=0}^nkP(X=k)...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問4
解説偏差値の求め方\A君の \(z\) 値は、\((80-60)/20=1.0\)より、A君の偏差値は、\となる。B君の \(z\) 値は、\((50-60)/20=-0.5\)より、B君の偏差値は、\となる。\(Z\sim N(0,1)\...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問3
解説調査で「内閣支持率が54%」とわかりました。しかし、これは たまたま978人に聞いた結果 なので、母集団(1496人全体)の 真の支持率 \(p\) とはズレる可能性があります。そこで、母集団の本当の支持率 \(p\) が入りそうな範囲...
確率の話題の中でも、「条件付き確率」や「ベイズの定理」は少し難しそうに感じられがちです。しかし、考え方自体はとても素直で、日常の判断にも深く関係しています。この記事では、条件付き確率とは何かベイズの定理がどのように導かれるのかどんな場面で役...
【統計検定準1級】2015年6月 選択問題及び部分記述問題 問2
解説不良品の個数を\(X\)とすると、\(X=r\)となる確率は二項分布に従い、\となる。\(p=0.4\)、\(r=2\)のときの確率は、\となり、小数点以下第3位を四捨五入すると 0.35 となる。不良品率が 0.2 のときの生産者危険...
AWS Certified Generative AI Developer – Professionalの試験概要と対策【AIP-C01】
今回は、AWS認定試験に新しく追加された「AWS Certified Generative AI Developer - Professional」のベータ版について、その試験概要と対策をまとめる。生成AI(Generative AI)の波...
※適切なものを選ぶか不適切なものを選ぶか要確認人工知能をめぐる動向探索幅優先探索:最短距離でゴールに辿り着く解を必ず見つける深さ優先探索:メモリ消費は比較的少ない システムまとめ第一次AIブーム(1950年代後半〜1960年代)エニアックイ...
Lispでデータ分析をやってみる (1) 環境構築とCSVファイルの読み込み
普段はPythonでデータ分析をしている私ですが、最近Lispを勉強し始めました。せっかくなので、Lispの学習を兼ねてデータ分析をLispで実装してみようと思います。このシリーズでは、Pythonでのデータ分析経験を活かしながら、同等の処...
Google Cloud(旧Google Cloud Platform)はクラウド環境として多くの企業に利用されています。しかし、初めて触れる方にとってはコストが気になり、なかなか試しづらいのではないでしょうか?そこで今回は、Google ...
AtCoder Beginners Selection を解く
前回からの続き。今回は、AtCoder Beginners Selection を解いていく。PracticeA - Welcome to AtCoder前回記事で扱った問題と同じため割愛。 ABC086A - Product偶奇を判定す...
【AtCoder】practice contest A問題 を解く
競技プログラミング「AtCoder」のレート向上を目指し、学習記録として記載する。今回は、practice contestのA問題を解いていく。A - Welcome to AtCoder数値の和と文字列を出力する問題。AtCoderをやる...
AWS Certified Machine Learning Engineer – Associateの勉強方法 勉強時間や使用教材について解説
この記事はこんな方にオススメAWS Certified Machine Learning Engineer - Associate (MLA-C01) に合格したい方今回は、AWS Certified Machine Learning En...
この記事はこんな方にオススメ複数のプロジェクトを同時に扱っていて、視覚的に区別したい方Cursorのカスタマイズ機能をもっと活用したい方作業効率を上げるための環境設定に興味がある方複数のプロジェクトを同時に開いていて、どのウィンドウがどのプ...
AWS認定資格の全体像と目的別おすすめ受験順を解説。CLF・AIF・SAA・MLA・AIP-C01など各資格の難易度・勉強方法記事へのリンクをまとめています。
Claude Codeから「昨日届いたメールをまとめて」「来週の会議を追加して」と話しかけるだけでGmailとGoogleカレンダーを操作できる。そんな環境をMCP(Model Context Protocol)で実現する手順を解説する。本...
解説(1)図1はモデル1(\(y = \beta_0 + \beta_1 x + \varepsilon\))の回帰診断図である。表より、USA(アメリカ合衆国)の実際の平均寿命 \(y\) は 78.8 である。図1の「(ア) Resid...
解説1. 最初のクラスター形成最近隣法、最遠隣法のどちらの手法を用いても、最も距離が近い 2 点が最初に結合する。表 2 の距離行列を見ると、最小の距離は個体 4 と 5 の間の \(\sqrt{2}\) である。よって、最初に形成されるク...
解説\(\overline{X^*}\) の値を確認する。表の一番右の列に、10回の繰り返しによって得られた各ブートストラップ標本の平均値 \(\overline{X^*}\) が記載されている。具体的な値は以下の 10 個である。5.1,...
解説出発時の傘の本数 \(X_n\) が、次の出発時 \(X_{n+1}\) にどう変化するかを調べる。状態空間は \(\{0, 1, 2\}\) であるため、それぞれの場合について場合分けを行う。① \(X_n = 0\) の場合(出発地...
解説(1)独立性を仮定した場合、各セルの期待度数は以下の式で求められる。\表の周辺度数(計の欄)から、以下の数値が読み取れる。女性の合計人数:39 人就業者の合計人数:68 人全体の合計人数:80 人これを式に当てはめると、女性の就業者の期...
解説(ア)について:誤り有限母集団から「母集団の半分の大きさの標本」を抽出する、すなわち \(n = \frac{N}{2}\) の場合を考える。問題文の冒頭で与えられている標本平均の分散の公式にこれを代入すると、以下のようになる。\計算結...
解説1. 1次の標本自己相関係数 \(\hat{\rho}\) の算出自己相関係数 \(\hat{\rho}\) は、「共分散を分散で割る」ことで求められる。問題文で与えられている残差系列の分散と共分散を用いて計算する。\この結果から、残差...
解説①・② 誤り1元配置と2元配置では、上述の通り残差平方和の構成が変わるため、残差分散の大きさは異なる。それに伴い、検定統計量である \(F\) 値も変わるため、「どちらの解析法でもよい」とは言えない。③ 誤り実験条件 \(A\) の平方...
解説1. 必要な数値の確認問題文の表から、以下の数値を読み取る。有効回答数(標本サイズ):\(n = 857\)イチロー選手が好きだと回答した割合(標本比率):\(\hat{p} = 0.224\)2. 95%信頼区間の公式標本サイズが十分...
解説まずは、問題文から与えられている前提条件を整理する。兄の身長を \(X\)、弟の身長を \(Y\) とする。\(X\) の期待値 \(\mu_X = 140\)、分散 \(\sigma_X^2 = 15^2\)\(Y\) の期待値 \(...
解説確率変数 \(T\) が \(t\) 以下となる確率を表す累積分布関数 \(F(t)\) は、全確率 1 から生存関数 \(S(t)\) を引くことで求められる。\\確率密度関数 \(f(t)\) は、累積分布関数 \(F(t)\) を...
解説フィッシャーの3原則反復(Replication) 同じ処理(今回であれば同じ肥料)を、複数の異なる実験対象(苗)に対して行うこと。これにより、偶然生じるばらつき(偶然誤差)の大きさを評価・推定できるようになり、実験の精度が高まる。無作...
解説自由度調整済み決定係数(\(\bar{R}^2\))は、説明変数の数が多いほど決定係数(\(R^2\))が大きくなりやすいという性質を補正した指標である。以下の公式で計算できる。\ここで、\(n\) はサンプルサイズ、\(k\) は説明...
解説帰無仮説 \(H_0\) が正しいと仮定すると、母比率 \(p = 0.4\) である。このとき、標本比率 \(\hat{p}\) の平均と分散は以下のようになる。平均:\(E(\hat{p}) = p = 0.4\)分散:\(V(\h...
解説1. 用いるべき分布の確認正規分布に従う母集団から抽出された標本において、標本平均からの偏差平方和を \(T^2\)、標本サイズを \(n\)、母分散を \(\sigma^2\) とすると、統計量 \(\frac{T^2}{\sigma...
解説1. 期待度数の計算1週間の合計問い合わせ回数は 42 回であり、曜日は 7 日間ある。どの曜日も均等に問い合わせが来ると仮定すると、1日あたりの期待度数 \(E\) は以下のようになる。\つまり、帰無仮説のもとでは毎日 6 回ずつ問い...
解説サイコロの目 1, 2, 3, 4 が出る確率を、それぞれ \(p_1, p_2, p_3, p_4\) とおく。問題文の条件「\(P(X=1) = P(X=3)\)」「\(P(X=2) = P(X=4)\)」より、以下が成り立つ。\\...
解説変動係数は、データの散らばり具合を相対的に評価するための指標であり、以下の公式で求められる。\餌を替える前の平均値は 55 kg、標準偏差は 11 kgであるから、\従って、餌を替える前の体重の変動係数は 0.2 である。餌を替えて飼育...
この記事はこんな方にオススメデータ探索の具体的な手法を知りたい前回の記事では、データ観察の方法について解説しました。データ観察が一通り完了したら、続いてはデータ探索を実施しましょう。データ探索は、データ分析や機械学習プロジェクトにおいて、隠...
この記事はこんな方にオススメデータサイエンスや機械学習を始めたばかりの人データサイエンスや機械学習を始めたばかりの人にとって、「まずデータをどうやって見ればいいの?」という疑問はよくありますよね。今回は、 データ観察(Data Observ...