ブログみるアプリ
日本中の好きなブログをすばやく見られます
無料ダウンロード
ブログ村とはIDが異なります
メインカテゴリーを選択しなおす
フォロー
【R】複数ファイルのファイル名を列追加し、結合する
Rで複数ファイルのファイル名を列追加し、結合する方法を紹介。サイズが大きいファイルを高速に入出力したいときは、data.tableパッケージのfread()とfwrite()がおすすめ。基本統計量の集計は、dplyrパッケージのsummarise()を使えば楽ちんです。
2020/03/20 01:01
Rで繰り返し処理するなら、forではなくsapply
R言語で繰り返し処理を実装する場合は、for()ではなくsapply()を使いましょう!なぜなら、for()では複数行のコーディングが必要なケースでも、sapply()ならたった1行で代替できることがあるからです。
2020/02/15 23:36
【備忘録】状態空間モデルの基礎~入門したけりゃ、馬場さんの本を読むべし~
本記事は状態空間モデルに主眼を置き、「状態空間モデルとは何か」を単純なローカルレベルモデルを使って解説しています。
2020/01/13 15:24
MTシステムにおけるマハラノビス距離をわかりすく解説
マハラノビス距離とは、複数の変数間に相関がある場合に相関関係を考慮した上で注目しているデータが中心点からどのくらい離れているかを表す距離です。 本記事では、MTシステムにおけるマハラノビス距離について、入門者でも理解しやすいように解説します
2019/12/29 15:28
「原因と結果」の経済学を読んだら、因果推論に入門できた
因果推論の入門書を探していたら、Twitterで "「原因と結果」の経済学 "という本を発見!この本は、因果推論を実例に沿って丁寧に解説されているため、大変読みやすかったです。また、数式はほとんど出てこないので、入門者に
2019/12/22 17:31
PDPとICEを利用したEDA(探索的データ解析)|R
この記事では、PDPとICEを利用したEDA(探索的データ解析) について解説します。PDPとICEは特徴量の値の変化による予測値の変動幅、寄与方向の参考になります。ICEは、pdpパッケージの関数partialとplotPartialを利用することで簡単に描けます。
2019/12/14 15:13
ランダムフォレストによるEDAをRで実践
ランダムフォレストによるEDA(探索的データ解析)の実例を紹介します。ランダムフォレストモデルが高い予測力を持っていて、特徴量と予測値の関係を可視化できれば、モデル構築の特徴量選択に利用できます。
2019/12/11 17:23
RによるEDA(探索的データ解析)
EDA(Exploratory Data Analysis, 探索的データ解析)とは、データの特徴を捉えるための手法の総称です。単純なデータに対して、Rを使用したEDAの実例を紹介します。統計モデリング過程において、EDAはモデリングの補助的に用いるものです。
2019/12/06 00:41
二項分布とポアソン分布の関係|ポアソン分布で在庫数を考える
ポアソン分布とは、ある期間に平均λ回発生する事象がk回起こる確率を表す分布です。 np=λが一定で、試行回数nが非常に大きく、生起確率pが非常に小さいとき、二項分布B(n,p)は平均λのポアソン分布に近似できます。ポアソン分布の素晴らしいところは、試行回数nが分からなくても、ある期間内の平均回数λさえ決まれば、確率を求めることができる点です。
2019/12/01 17:54
ベルヌーイ分布と二項分布
2種類のみの結果しか得られないような試行をベルヌーイ試行といいます。ベルヌーイ分布とは成功確率pのベルヌーイ試行を1回行って得られる確率分布です。二項分布とは成功確率pのベルヌーイ試行をn回行ったときに成功する回数Xが従う確率分布です。
2019/11/28 00:08
確率変数、確率分布とはなんぞや!?
確率変数とは、起こりうる事象に割り当てている値を取る変数です。 確率分布は確率変数の各値に対応する確率の変動を表したものです。 確率変数には「離散型」と「連続型」があり、連続型変数の確率分布を表すのに使われるのが確率密度関数です。
2019/11/23 00:58
確率分布の使い方|正規分布
この記事では、統計学において最も重要な確率分布の1つである正規分布の特徴とその使い方をご紹介します。
2019/11/20 01:32
【図で理解する!】平均と分散と標準偏差|そのデータは一峰性?
代表的な基本統計量である平均、分散、標準偏差について、図を使って解説します!基本統計量を扱うときの注意点を理解して、統計量を正しく扱いましょう!
2019/11/12 23:55
【もっと早く行っときゃよかった…】Sports Analyst Meetup#5~スポーツ好きに悪い人はいない~
Sports Analyst Meetupに初めて参加してみたら、現役スポーツアナリストの生々しいおもしろ話が聴けて最高でした。スポーツ業界に限らず、自身の業界にも通じる、データ分析における大切な視点が学べました。
2019/11/03 17:39
決定木の分類ルールセットを編集して予測する方法|R
この記事では、決定木モデルの分類ルールセットを編集する方法をご紹介します。決定木でテストデータの予測を行う前に、訓練データから派生した分類ルールセットを編集したい場合に役立ちます。
2019/10/27 19:58
ロジスティック回帰分析の基礎をわかりやすく解説
データ分析業務でロジスティック回帰分析を実践している私が、ロジスティック回帰の基礎をわかりやすく解説します。初心者の方にもわかりやすいように、専門用語や数式をなるべく使わずに説明していきます。
2019/10/22 17:36
決定木をわかりやすく解説|Rで実践
統計解析ソフトのRで決定木分析を実践する方法について解説します。決定木の特徴、分析手順、分析結果の解釈方法を詳しく説明します。
2019/10/12 15:08
【2019年10月】Googleアドセンス審査に最短で合格する方法
私がブログ運営開始17日目でGoogleアドセンスに一発で合格するために準備したことをご紹介します。
2019/10/06 01:51
【初心者でも簡単】Pythonのscikit-learnで重回帰分析
Pythonのscikit-learnライブラリを使って重回帰モデルを作成する方法をご紹介します。モデルによる予測の考え方についても触れています。
2019/10/02 22:54
【Rユーザー必見】超便利!Rstudioの使い方
この記事では、Rstudioのメリットと使い方についてご紹介します。
2019/09/29 18:51
重回帰分析をわかりやすく解説|統計解析ソフトRで実装
ビジネスでも役立つ重回帰分析について、初心者の方でも理解できるようにポイントを絞って解説します。また、統計解析ソフトのRを使って重回帰分析を実践する方法もご紹介します!重回帰分析とは目的の数値の変動を複数の要因でどの程度説明できるかを分析することです。
2019/09/28 12:00
【申込手順】Python 3 エンジニア認定データ分析試験
Python 3 エンジニア認定データ分析試験の申込み手順を画像付きで徹底解説!
2019/09/22 15:21
Python 3 エンジニア認定データ分析試験の合格攻略法
2019年9月20日に Python3 エンジニア認定データ分析試験(β版)を1000点満点で合格した私が、同試験の攻略法をご紹介します。Python 3 エンジニア認定データ分析試験の概要、オススメの勉強法、出題された問題を紹介します。
2019/09/21 11:26
書籍「Pythonによるあたらしいデータ分析の教科書」を読んで学んだこと
Python3 エンジニア認定データ分析試験対策で「Pythonによるあたらしいデータ分析の教科書(翔泳社)」 を読みました。どんな人にオススメ?どんなことが学べるの?
2019/09/16 11:28
1件〜100件
「ブログリーダー」を活用して、ナバさんをフォローしませんか?