データ分析のスキルアップに役立つ情報を発信するサイトです。データ分析に関する資格や書籍の情報、PythonやRによるデータ分析の実践方法を紹介してます。
マハラノビス距離とは、複数の変数間に相関がある場合に相関関係を考慮した上で注目しているデータが中心点からどのくらい離れているかを表す距離です。 本記事では、MTシステムにおけるマハラノビス距離について、入門者でも理解しやすいように解説します
因果推論の入門書を探していたら、Twitterで "「原因と結果」の経済学 "という本を発見!この本は、因果推論を実例に沿って丁寧に解説されているため、大変読みやすかったです。また、数式はほとんど出てこないので、入門者に
この記事では、PDPとICEを利用したEDA(探索的データ解析) について解説します。PDPとICEは特徴量の値の変化による予測値の変動幅、寄与方向の参考になります。ICEは、pdpパッケージの関数partialとplotPartialを利用することで簡単に描けます。
ランダムフォレストによるEDA(探索的データ解析)の実例を紹介します。ランダムフォレストモデルが高い予測力を持っていて、特徴量と予測値の関係を可視化できれば、モデル構築の特徴量選択に利用できます。
EDA(Exploratory Data Analysis, 探索的データ解析)とは、データの特徴を捉えるための手法の総称です。単純なデータに対して、Rを使用したEDAの実例を紹介します。統計モデリング過程において、EDAはモデリングの補助的に用いるものです。
ポアソン分布とは、ある期間に平均λ回発生する事象がk回起こる確率を表す分布です。 np=λが一定で、試行回数nが非常に大きく、生起確率pが非常に小さいとき、二項分布B(n,p)は平均λのポアソン分布に近似できます。ポアソン分布の素晴らしいところは、試行回数nが分からなくても、ある期間内の平均回数λさえ決まれば、確率を求めることができる点です。
「ブログリーダー」を活用して、ナバさんをフォローしませんか?
指定した記事をブログ村の中で非表示にしたり、削除したりできます。非表示の場合は、再度表示に戻せます。
画像が取得されていないときは、ブログ側にOGP(メタタグ)の設置が必要になる場合があります。