#モデルチューニングのブログ記事

2025/05/02 02:45
Record of Signate War

“採血データを使った心不全予測"のコンペに参加したので、解法を示します。まず、基本的に、2つの分類の予測問題は元々慣れていたので基本的なフレームとしては以下の通りです。探索的データ分析ベースラインモデルの作成予測モデルの作成探索的データ分析まず、最初にデータを一応概観してみました。発売中の技術同人誌 “Pythonによる探索的データ分析クックブック“でも触れている、ydata-profilingを使用しています。 import os import sys import pandas as pd import polars as pl import pyarrow as pa import numpy as np import matplotlib.pyplot as plt import seaborn as sns from ydata_profiling import ProfileReport train_df = pd.read_csv("../data/train.csv") test_df = pd.read_csv("../data/test.csv") profile = ProfileReport(train_df, title="Heart Failure Report") profile.to_file("../profile/heart_failure_report.html") ベースラインモデルの作成基本線となるベースラインモデルを作成しました。ベースラインモデルは文字通りベースラインモデルなので、複雑なものは避けるのがセオリーです。今回は二つの分類をするタイプなので、一般化線形回帰でロジスティック回帰に持ち込むのを基本としました。また、stepwiseなどの容易さから、一旦、Rでモデリングを進めました。コードとしては以下のシンプルきわまるものです。 require(dplyr) require(readr) require(ggplot2) require(pROC) train.df <- read.csv("../data/train.csv") test.df <- read.csv("../data/test.csv") train.df <- train.df %>% mutate( anaemia = as.factor(anaemia), diabete
- #データ分析
- #Signate
- #コンペティション
- #心不全予測
- #Python
- #R
- #CAP図
- #モデルチューニング
フォローできる上限に達しました。

新規登録/ログインすることで
フォロー上限を増やすことができます。

フォローしました

リーダーで読む
フォロー
G.O.R.N
Grayrecord Technow

にほんブログ村 カテゴリー一覧

注目ハッシュタグ

にほんブログ村カテゴリー一覧