メインカテゴリーを選択しなおす
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
インターネットにおける情報の信頼性とは?定義から信頼性の判断方法まで解説!
情報の信頼性は専門性と信用性から判断できます。今回の記事では、情報の信頼性の定義からインターネットでの信頼性の基準、見分け方について簡単に解説しています。
k近傍法(kNN)とは?仕組みからpythonでの実装までわかりやすく解説!
k近傍法はあるデータを分類するという場面で用いられる手法です。シンプルな仕組みであるため、理解しやすく実装も容易に行えます。今回はk近傍法について、仕組みや実用例、Pythonでの実装、メリット・デメ
機械学習の評価指標はどう選ぶ?回帰、分類の評価指標をわかりやすく解説!
機械学習の評価指標はモデルの性能を客観的に評価するために重要です。評価の中でも評価指標はモデルの予測精度や性能を定量化するために用いられます。この記事では、回帰タスクと分類タスクにおける代表的な評価指
機械学習における正則化とは?L1正則化とL2正則化やPythonでの実装までわかりやすく解説!
正則化はモデルの作成の際に過学習を抑えるために用いられる手法です。正則化にはL1正則化とL2正則化が存在しそれぞれ特徴が存在します。今回の記事では、正則化の概要や目的、L1正則化とL2正則化の特徴と実
過学習(Overfitting)とは?起こる原因から見分け方・対策方法までわかりやすく解説!
過学習は学習のために用いたデータに過度に適合することで、未知のデータに対する予測精度が低くなってしまう現象です。今回の記事では、過学習の原因から見分け方・対策方法まで解説しています。
交差検証法とは?種類やPythonの実装・ホールドアウト法との違いまでわかりやすく解説
交差検証法とはデータを等分し、それらのデータの1つをテストデータとして繰り返しテストを行うモデルの評価方法です。本記事では、モデルの評価方法の1つとして重要な交差検証法について種類やPythonでの実
アンサンブル学習とは?3つの種類や注意点までわかりやすく解説
アンサンブル学習とは複数のモデルを組み合わせることで予測精度を上げる手法です。今回の記事ではアンサンブル学習の3つの種類からバイアスとバリアンス、注意点について解説していきます。
2nd STEP開始! #15 どのような集計をして、グラフを描くのか?
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
全ての企業が避けて通れないCookie規制問題 CDPは救世主足り得るか
参考 CDP活用のための人材育成やデータ利活用プロジェクトの推進など、 もっと深く学びたい方はこちら書籍がお薦めです。 CDP活用の最適解を導く 事例から見えてくる、人材、プロジェクト、組織の在り方
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
データサイエンティストの基礎作業を体験することによって、データサイエンスの基礎力を取得し、データ思考を身に付けるブログ。データ思考は、データサイエンティストだけでなく、ビジネス・パーソンの能力向上、キャリアアップに役立ちます。
みなさん、こんにちは! 猫のタローです。猫の姿をしていますが、前世ではデータサイエンティストをしていました。これから、データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」を始めます。 まずは、 なぜ、データサイエンスを体験するのか? ご説明します。 それは、...
こんにちは!前回は、なぜ、データサイエンスを体験するのか?を説明させていただきました。 いよいよ、本論に入っていきたいと思います。 「データサイエンス チュートリアル」は、1st STEPとして「 ビッグデータの読み込みとデータの確認 」、2nd STEPとして「 集計とグラフ描...
#3 分析に使うデータの準備とGoogle Colaboratory(コラボ)にアクセスしよう!
さて、#3は、 分析に使うデータの準備とGoogle Colaboratoryを説明します。 #3でつまずき易いの は、 GoogleドライブやGoogle Colaboratory(以下「コラボ」)のファイルがどこに存在しているかを理解 することです。これは、慣れればどうという...
データサイエンスを身に付けるためには、データ分析を自らが行うことが大切です。理論を学ぶだけでは理解することが難しいですし、なにより目の前のデータを自分で分析して、自分なりの仮説を立てることはとても楽しいことです。 その際に、どのプログラム言語から学ぶのか、迷ってしまうことがあるで...
(1) 色々な 業務の効率化 や Webプログラミング などの一般的なPythonプログラミングを基礎から使いたいという場合は、公式版のPythonをインストールします。 Python Japanが「Python環境構築ガイド」を公開しています。 ■ Python環境構築ガ...
Pythonの基礎を学ぶイチオシの教材としては、下記の書籍があります。 Pythonの中で、データ分析や機械学習のプログラミングで最も使われるライブラリ(*1)である Pandasの開発者Wes McKinney による人気のテキストです。データ分析を行うための基本を網羅してお...
#4は、「 ライブラリの選択とデータの読み込み」を説明します。 #4では、いよいよそこそこ大きなデータ(約54万行)を読み込んでいきます。前回G oogleドライブ に保存したデータを、 コラボ で読み込んで活用していきます。 ■ 動画を見る前に、 下記の PowerPoint(...
データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第5回目は、読み込んだデータの確認(1)を説明します。まずは、データの 目視確認 です。 読み込んだデータ、処理をしたデータは必ず目視確認するようにしましょう!正確な分析をする上での基本です。 データを...
データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第6回目は、読み込んだデータの確認(2)を説明します。今回は、下記のプログラムを使って、データのサイズを取得する方法を解説します。 ⑥ len(データ名.index) ⑦ データ名["カラム名"]...
データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第7回目は、「 データ型 」を説明します。 Pandas では、各列ごとにそれぞれデータ型を保持していて、データ型それぞれに合った処理方法が決められています。このデータ型を確認する方法と、データを読み込む...
データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第8回目は、「 列の参照 」を説明します。 Section 3と4では、データ全体を確認することを習得しましたが、ここでは、特定の列を選んで、確認する方法を解説します。 ⑪ データ名[“列名”] ⑪'...
データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第9回目は、「 数値の最大値の求め方 」を説明します。 以前のデータの確認では、データ数を確認するだけでしたが、最大値、最小値、平均などの 要約統計量 を確認することも重要です。 今回は、最大値を中心...
Juliaでニューラルネットワークを使ってタイタニック生存者予測をする
長いタイトルになりました。今回は、JuliaのFluxを使ってニューラルネットワークを計算して、タイタニック号の生存者予測をしていきます。Fluxを使ってみたかった、、ぐらいの話なので、精度はとか。。パラメーターは。。。とかはあまり突っ込ま
juliaでグラフを描画する方法を解説してきます。今回は応用編1ですCSVやDataFramesなどを使ってタイタニックのデータを加工して、グラフに描画していきましょうPlotsのパッケージのインストールやインポートの方法はJuliaでグラ
R ggplot2で回帰直線を書く方法(geom_smooth)
散布図に回帰直線も載せたい! 回帰直線の色や線の種類などを変えたい! そんなお悩みを解決します。本記 ...
Pythonのプログラミング経験ゼロだったアラフォーが、わずか2週間でPython3エンジニア認定基礎試験に合格した勉強法を公開しています。
「経済講演会『ウィズ/アフターコロナ ニューノーマル時代の小売・飲食店のDX戦略』開催のご案内」
こんにちは。スマホに御嶽海のざんばら髪時代の写真が残っているカピバラです大相撲初場所、盛り上がりましたよね。雷電以来の長野県出身大関誕生ですね。初場所といえば、このところ、やけに「初優勝」力士が誕生しているような気が・・・。玉鷲でしょ、徳勝龍でしょ、大栄
デジタルスキルの基となるセキュリティ&暗号化、統計学、データサイエンス、AI・機械学習・深層学習、プロジェクトマネジメントやブロックチェーン(Web3.0)を学べるサイトをまとめました!デジタル人材になるための勉強法は全ての人に関係あります!なぜなら、
【統計検定2級】3週間勉強して不合格、さらに2週間勉強して合格した勉強法
「確率・統計」なんて忘却の彼方だったアラフォーが、わずか1ヶ月で統計検定2級に合格した勉強法を公開しています。
知識0から合格!AI資格 G検定(ジェネラリスト検定)の試験対策
この記事では知識ゼロから2か月で「G検定(ジェネラリスト検定)」に一発合格した、私の試験対策を紹介します。 G検定とはどんな試験か、勉強方法、試験の解き方、取得するメリットを記載しています。