ブログみるアプリ
日本中の好きなブログをすばやく見られます
無料ダウンロード
ブログ村とはIDが異なります
メインカテゴリーを選択しなおす
フォロー
【モデル比較】SVM・決定木・ランダムフォレストの精度と解釈性の違い
はじめに分類タスクにおいて、さまざまなモデルが利用できますが、どれを選べばよいのでしょうか?本記事では代表的な分類アルゴリズムである以下3つのモデルについて、精度と解釈性(説明のしやすさ)の観点から比較します。サポートベクターマシン(SVM...
2025/05/10 21:14
【分類④】混同行列・精度・再現率・F1スコアの正しい使い方
はじめに分類モデルの性能を評価する際に、「精度(Accuracy)」だけを見て満足していませんか?実は分類問題では、「どのクラスをどれだけ正しく予測できているか」を詳しく確認する必要があり、そのための指標が「混同行列」や「精度・再現率・F1...
2025/05/10 00:33
【応用①】クロスバリデーションとグリッドサーチで精度を上げる方法
はじめにこれまでの記事では、様々な機械学習モデルの実装方法と、過学習を防ぐための正則化について学んできました。本記事では、モデルの性能をさらに高めるためのテクニックである「クロスバリデーション(Cross Validation)」と「グリッ...
2025/05/10 00:12
【回帰③】正則化(Lasso, Ridge)を用いたモデルチューニング
はじめに前回は多項式回帰を通じて、モデルが複雑すぎると「過学習(Overfitting)」が起きやすくなることを学びました。今回はその対策として有効な手法「正則化(Regularization)」について解説します。正則化を導入することで、...
2025/05/09 23:49
【回帰②】多項式回帰と過学習の関係を体験する
はじめに前回は、線形回帰によって直線的な関係を予測しました。今回はその発展として「多項式回帰(Polynomial Regression)」を扱います。多項式回帰では、直線では表現しきれないような曲線的な関係も学習可能になります。その一方で...
2025/05/09 19:54
【回帰①】線形回帰で家賃予測モデルを作る
はじめに分類問題の次は、数値を予測する「回帰問題」に挑戦してみましょう。最も基本的な回帰アルゴリズムが「線形回帰(Linear Regression)」です。本記事では、部屋の広さに応じて家賃を予測するというシンプルな課題を通じて、線形回帰...
2025/05/09 19:44
【分類③】決定木・ランダムフォレストの特徴と可視化方法
はじめにこれまでに紹介したK近傍法やロジスティック回帰は、比較的単純な分類モデルでした。今回紹介する「決定木(Decision Tree)」と「ランダムフォレスト(Random Forest)」は、より柔軟で複雑な分類タスクに対応できるアル...
2025/05/09 19:25
【分類②】ロジスティック回帰でスパム判定をしてみよう
はじめに分類問題を解く上で、もっとも基本かつ応用範囲の広いアルゴリズムの一つが「ロジスティック回帰(Logistic Regression)」です。回帰という名前がついていますが、これは 分類 を行うためのモデルです。確率的に分類を行うため...
2025/05/09 19:17
【分類①】K近傍法(KNN)を使ってシンプルな分類をしてみよう
はじめに本記事では、scikit-learnを使った分類モデルの最初の一歩として「K近傍法(KNN)」を紹介します。KNNはもっとも直感的でシンプルな分類アルゴリズムの一つであり、「似ているデータに注目して予測する」という考え方で動作します...
2025/05/09 18:53
【準備】sklearnのインストールとデータセットの扱い方
はじめにscikit-learn(sklearn)を使って機械学習を始めるにあたり、最初に押さえておくべきことが「ライブラリのインストール」と「データの準備」です。本記事では、sklearnをインストールする方法と、学習用のデータセットをど...
2025/05/09 18:31
【入門】scikit-learnとは?機械学習の全体像と学習の流れ
はじめに「機械学習をやってみたいけど、どこから始めればいいの?」という方に向けて、Pythonで機械学習を始める最初の一歩となるのがこの回です。本記事では、Pythonの機械学習ライブラリ「scikit-learn(sklearn)」の特徴...
2025/05/09 17:45
NumPy中級まとめ|配列操作・演算・条件処理を体系的に復習しよう
はじめにNumPy中級シリーズでは、配列の操作から条件処理、シミュレーションまで、実務や学習に役立つ内容を順を追って学んできました。本記事では、これまでの内容を総復習しつつ、理解を深めるための演習問題や実用パターンの整理を行います。「全体の...
2025/05/09 01:35
NumPy中級⑤:便利関数大全|np.where, np.any, np.all, np.select を使いこなす
はじめにNumPyには、配列の操作や条件分岐、ブール評価などを簡潔に記述できる便利関数が多数用意されています。中でも np.where、np.any、np.all、np.select は、データの前処理や集計、可視化において頻出の関数です。...
2025/05/09 01:28
NumPy中級④:乱数生成とシミュレーション|再現性と統計処理の基本
はじめにデータ分析や機械学習の世界では、「乱数」は欠かせない要素です。サンプリング、モデルの初期化、シミュレーション実験など、さまざまな場面で乱数が活躍します。NumPyには強力な乱数生成機能が備わっており、np.random モジュールを...
2025/05/09 01:18
【保存版】統計&Pythonデータ分析シリーズまとめ|基本〜中級をやさしく解説
📊 統計シリーズ 一覧▶ 基本統計量とデータの基礎理解「基本統計量をマスター!相加平均・中央値・最頻値・分散・標準偏差を実例でわかりやすく解説」データの広がりを一目で把握!箱ひげ図の読み方と使い方外れ値を見つけた後にどう対応すべきか?外れ値...
2025/05/05 03:01
【実践編】pandasで都道府県別・男女別売上を集計する
はじめに実務におけるデータ分析では、「都道府県ごと」「男女別」などのカテゴリごとの集計は頻出です。Excelのピボットテーブルで行っていた処理を、Pythonとpandasで再現できれば、作業効率は劇的にアップします。本記事では、panda...
2025/05/05 00:51
【pandas中級編④】groupbyの集計パターン大全(aggで複数指標)
はじめにpandasの groupby() は、カテゴリごとの集計処理に欠かせない関数です。「性別ごとに平均を出したい」「学年ごとに最大点数と最小点数を同時に知りたい」など、実務でもっともよく使われるデータ分析手法の一つです。この記事では、...
2025/05/04 23:19
【pandas中級編③】pivot_tableの使い方をやさしく解説(Excel派必見!)
はじめにExcelでおなじみの「ピボットテーブル」。pandasでも、同様の機能が pivot_table() を使うことで簡単に実現できます。グループごとの平均や合計を見たい男女別・年齢別などでクロス集計したい行と列で集計を並べて、見やす...
2025/05/04 19:56
【pandas中級編②】列の追加・削除・名前変更・順序変更まとめ
はじめにpandasを使ったデータ処理では、「列の操作」がとても重要です。機械学習や統計処理に進む前に、データを“整える”作業=前処理が必要になりますが、その多くが「列の追加・削除・並べ替え・名前変更」といった作業です。たとえば:余分な列を...
2025/05/04 19:45
【pandas中級編①】mergeとconcatで複数の表をつなげる方法まとめ
はじめに複数のデータを1つにまとめたいとき、pandasには主に2つの方法があります。merge() … SQLのJOINのように横方向で結合するconcat() … 縦や横に「そのまま並べる」ようなイメージ「似ているようで、まったく使いど...
2025/05/04 19:30
【初心者向け】pandasの使い方をわかりやすく解説|データフレームの基本操作まとめ(最後に問題付き)
第1章:はじめに ~pandasって何?なぜ使うの?~Pythonでデータ分析や統計処理を始めようとしたとき、最初にぶつかる壁は「表形式のデータをどう扱えばいいのか?」ということです。たとえば、CSVファイルやエクセルのような行と列のデータ...
2025/05/04 18:22
2025年5月 (1件〜100件)
「ブログリーダー」を活用して、趣味の小部屋ワードプレスさんをフォローしませんか?