chevron_left

メインカテゴリーを選択しなおす

cancel
身の回りのデータサイエンス https://gassann.hatenablog.com/

「データサイエンスを使えば人生がちょっとだけ便利になる」をモットーに、興味の赴くがままに身の回りのデータを分析しています。

がっさん
フォロー
住所
未設定
出身
未設定
ブログ村参加

2024/05/06

arrow_drop_down
  • 食事の最適化:最小限の食材で1日の必要栄養素を満たすには

    みなさんは健康的な食事を摂れていますか。健康的な食事の基準として、1日の必要栄養摂取量を満たしているかがあります。しかし、そのためにはいろいろな食材を摂る必要があり、忙しい人にとってはなかなか実現が難しいですよね。 そこで今回は、数理最適化というものを使って、1日の栄養素を満たせる最低限の食材を算出してみます。 データ 1日の栄養摂取量 食材毎の栄養素 数理最適化 数理最適化とは 栄養問題を数理最適化に当てはめる 実装 結果 結果① 修正 結果② データ 1日の栄養素を満たす食品を算出するには、1日に必要な栄養素の量と、食材毎の栄養素のデータが必要になります。 1日の栄養摂取量 1日に必要な栄…

  • 日本のアーティスト名は英語と日本語どちらが多いのか

    日本のアーティスト名は、SMAP・B'zのようなアルファベットのパターン、嵐・米津玄師のような漢字のパターン、AKB48のようなアルファベットと数字が混ざったパターンなど、様々なパターンが存在します。 ではどのパターンが最も多いのでしょうか? 日本人アーティスト名のパターンを分析してみましょう。 データ 前処理 可視化 日本語vs英語 宇多田ヒカル vs 浜崎あゆみ ゆず vs コブクロ 数字 まとめ データ 日本人アーティストの一覧データはこちらのサイトから抽出します。記載されている3653組のアーティストを今回の分析対象とします。 rockinon.com 抽出方法はこちらのサイトを参考に…

  • サッカー代表ユニフォームは何色が多いのか

    日本代表のユニフォームは「サムライブルー」と呼ばれる青色を基調としています。他に青色のユニフォームの国としてはフランスやイタリアがあります。一方で、これらの国以外に青色のユニフォームの国は思い浮かびますでしょうか?私は思い浮かびませんでした。 「もしかするとユニフォームが青色の国は少ないのでは?」 「最も多く使われているのは何色なのだろう?」 という疑問を持ったので、世界各国のサッカー代表ユニフォームの色について分析してみることにしました。 データ 可視化 まとめ データ 各国の最新の代表ユニフォームは以下のサイトに掲載されています。しかし、ユニフォーム情報はテキストではなく画像データのため、…

  • Wingspan攻略記~捕食の成功率~

    私がよくプレイする鳥の一つにハイイロチュウヒがいます。同様の効果を持つ鳥は他にも アカオノスリ アメリカフクロウ アレチノスリ カタアカノスリ クーパーハイタカ がいます。 引いたカードが75cm未満なら1点入り、割と成功確率が高い印象なのですが、実際の成功率はどれくらいなのかを算出してみることにしました。まずは翼長の分布図を見てみます。 翼長は左に偏りがある分布となっています。翼長の大きい猛禽類よりも、小鳥の方が多いことからも納得できるかと思います。 次に具体的な75cm未満の鳥の枚数を算出してみます。75cm未満の枚数:318枚(446枚中) 成功率:71%(317/445) ※自分自身は…

  • 各都道府県の出身者数を算出してみた

    皆さんは自分の都道府県の出身者数が何人くらいなのかを知っていますでしょうか? 都道府県別の人口は見たことあっても、出身者数となると意外と知らないのではないのでしょうか? 実はそれもその筈で、都道府県別の人口はe-Statでもデータが公開されているのですが、出身者数に関してはデータがないのです。 Googleで「都道府県別 出身者数」「〇〇県 出身者数」と検索してみても、ヒットするのは芸能人やスポーツ選手の都道府県別出身者数です。 そこで今回は、都道府県別の出身者数を算出してみようと思います。 使用データ 算出方法 データ前処理 可視化 まとめ 使用データ 出身者数を直接表すデータはないので、別…

  • ピン芸人とコンビはどちらが多いのか?

    ある日お笑い番組を見ていると、ふとこんな疑問が湧きました。 「ピン芸人とコンビはどちらが多いんだろうか?」 テレビを見ている限りではピン芸人よりもコンビの方が圧倒的に多い印象です。 一方で、コンビは相方を探す必要があるのに対して、ピン芸人は一人で出来るため、芸人になるハードルが低いのも事実です。 テレビに出ていないから知られてないだけで、もしかしたらピン芸人もかなりの数がいるのでしょうか? そこで、データを分析してピン芸人とコンビの数を分析してみることにしました。 まずは入手しやすいデータとして、漫才の大会であるM1と、ピン芸の大会であるR1の出場者数を比較してみましょう。 2023年のエント…

  • 失点を除いたDFのAAスコア

    今回のJリーグ分析では、スコアが出るDFを調べてみたいと思います。 通常のAAスコアtop10 失点の影響を除いたAAスコア まとめ 安定して高スコアを出せる選手を探すのに、過去の平均AAを見られてる方は多いのではないのでしょうか。 しかしDFに関しては、AAスコアで評価するのは問題があります。 なぜならDFのAAスコアには失点数「Goal conceded」とクリーンシート「Clean sheet」が含まれているからです。 Goal conceded:1失点毎に-4点 Clean sheet:クリーンシートの場合は+10点 失点の有無は個人の能力よりもチームのパフォーマンスが影響します。 仮…

  • ChatGPTが作ったネタはお笑いライブでウケるのか検証してみた

    2024年の芥川賞受賞作品の一部に生成AIが使用されていることが話題になりました。ChatGPTを代表とする生成AIの登場により、小説や絵、音楽などの創作のハードルが大きく下がりました。 ではお笑いにおいてはどうでしょうか?生成AIはネタを作成できるのでしょうか?そのクオリティはどの程度なのでしょうか? この疑問を検証するために、ChatGPTにネタを作成させ、実際にお笑いライブに出演してそのネタがウケるかどうかを試してみることにしました! ネタ作り では早速ネタを作っていきます。 いきなり「ネタを作って」というプロンプトを投げるのではなく、まずは①テーマを作らせ、②そのテーマに基づいたボケを…

  • 西野カナに「恋」とは何か聞いてみた

    いきなりですが、みなさん恋してますか? 僕は出来てないです。というか恋が何か分かってません(笑)。 好きは分かるけど、恋って何か重い感じがする。「恋してる」何て言ったことないし、恋って何だーと思ったので、定義を調べてみると、 恋:異性に愛情を寄せること、その心。 ほほう。愛情とは? 愛情:相手にそそぐ愛の気持。 ほほう。愛とは? 愛:そのものの価値を認め、強く引きつけられる気持。 うーん….よく分からないので、よく恋をしてそうな西野カナ先生に聞いてみましょう! どうやって聞くか? 会って直接!とはいかないので、今回は西野カナ先生の歌に対して自然言語処理をして、先生が恋をどのように表現しているか…

  • 年間365冊読んでわかった、冊数で読書目標を設定すべきでない理由

    はじめに 手段の目的化 ①無駄な読書が発生する ②専門書を読まなくなる ③情報収集の効率が下がる まとめ はじめに 今年の目標として、「〇〇冊本を読む!」といった読書目標を立てられている方は多いのではないでしょうか。 昨年の私もそうでした。私の場合は、「年間365冊の本を読む!」と目標を立て、なんとかやり切りました(しんどかった。。。) ただやってみて分かったのですが、このような冊数での読書目標を設定することはオススメしません!なぜなら、本を読むこと自体が目的になってしまい、3つの弊害が生じるからです。この記事では、実体験を通して学んだ、冊数で読書目標を設定すべきでない理由をご説明します。 手…

arrow_drop_down

ブログリーダー」を活用して、がっさんさんをフォローしませんか?

ハンドル名
がっさんさん
ブログタイトル
身の回りのデータサイエンス
フォロー
身の回りのデータサイエンス

にほんブログ村 カテゴリー一覧

商用