文系の人間がなぜかデータサイエンティストを目指し始めた! 謎の道中を記録していくブログです。 …とはいえ、普通にバイクのことも書いたりします。
2020年6月
最近忙しいぞ…!朝に書くべきか!?しかし…しかし!朝に書けっていうけど、実際問題朝活なんてしたかないぞ!?朝はご飯食べて本読むだけにしたい!うにゃー!
今日はほんと久しぶりに客先へ回った。このご時世、外に出づらいからなぁ。こんな世の中こそ、リモートにするチャンスだが、やっぱり価値観が違う会社さんも当然あるし、日本で完全リモート化ってのはまだまだ先かな。さて、ほいじゃ今日もおつかれー
どーもありがとうございます、最近「うちの会社の業務でBIツールなんかいらねんじゃね?」と思っている文系マン、かんきっくです。いや、なんか最近エクセルバカにする風潮ありますけど、割とグラフも充実してますよね。うーん、どうなんだろ。さて、本日も復習まとめていき
どーもありがとうございます、ある時はゲームオタク、またある時はバスケマニア、しかしてその正体は文系マン、かんきっくです。そう、これブログではあまり書く気はなかったんですが、私、中高とバスケ部でして、そのちょっと前から、NBA…、最近はこの子のおかげで有名にな
どーもありがとうございます、今日会社で暗算が早いとほめられた文系マン、かんきっくです。暗算ったって5+6くらいなもんでしたけどね。で、今日はカイ二乗分布なんて話なんですけども、ちょっと難しかったのですごく噛み砕きながら復習をまとめときます。・母集団での標準
タイトルの通りです。せっかくブログ付けてるんだから、何か1日の記録をつければ良いのだが、まあそれは自分の中だけにしときます。画像は近江ちゃんぽん。ちゃんぽんとはいいますが、本場のちゃんぽんとはだいぶ違います。関西風の、脂っぽさは
勉強しようと思ったけど、結構難しい内容だし頭痛いしで今日はおやすみ。明日はがんばろ。
どーもありがとうございます、5+8=16と答えた文系マン、かんきっくです。なんででしょうね。・母平均を推定したい!なんかこう、ここまで復習してきたら、なんとなくピンとくるもんですが、当然、平均、S.D、分散とかときたら、推定をしようという話になります。で、正規
evernote、仕事で使ってなかったのかなり損してた感じある。
どーもありがとうございます、最近ライフハックに手を出した文系マン、かんきっくです。…というかあれ、物事の効率化の話なんすね。まあ、それはいいとして。最近、仕事でevernoteに手をだしましたよ。みんなシステム手帳大好きで、いや俺も使うけ
どーもありがとうございます。最近、√の計算が増えてきたけど今いち理論がわかっていない文系マン、かんきっくです。今日も復習していきます。・データの偶然を消すために前回の記事で母集団ってのを推測するうえで、母平均、んで、標準偏差もあるってのを復習しました。で
ペルソナ5Rやってたら休日終わった画像は伊勢うどん。ぐにゃんぐにゃんでうどんっぽくないが、あじしみしみで私は好きでした。三重県、また行きたいなー。
どーもありがとうございます。算数ができない文系マン、かんきっくです。(そういや挨拶入れてないなってことで今回から入れてみる)いきなり大層なタイトルですが、ちょっと思った…というか、当たり前のことに気づいたので、また忘れないように、戒めとして書きます。何か
・分布の様子ってどう捉えるんだっけ?今回は短めです。かなり最初の話になるんですが、そもそもデータってのは、平均値の周りにあるけれど、平均値は一つデータを代表して取り出しただけなので、これではあまり分布の様子をつかめていないって話でした。要は散らばり具合…
ちょいと前までは、自分磨きとかそういうの、どこかバカにしてたなぁ。あれ、なんだったんだろう。いじけてたんかな?世の中、人の悪口とかばっかり言う奴多いからなぁ。とにかく人の足引っ張ろうと必死な奴。…ふぅ。というわけで、勉強して
・母集団って?ここまで復習した分で、ひとまずは推測に使う手段の一部分は勉強したのかな。で、ちょっと前に勉強した内容に、母集団という概念がありました。これは、つまりは「観測されたデータの大元」って感じです。で、全データの数が有限の母集団が有限母集団、反対に
ブログを始めて数日が経ったわけだけど、最初に書いた通り、僕がブログを始めた理由、勉強の復習については、幾分か効果を成していると思う。やっぱり、忘れないもんね、どれがどういうことだったのか、とか。頭で反芻してみて、定着率が全然違うと実感する。あ、この手法は
・検定しまくって求められる区間前記事で書いた検定で予言的中区間を考えたとき、棄却する、しないを繰り返していくと、結構な数の母数が出ますね。この母数の入りそうな区間を考えると、入るべき区間を「95%信頼区間」、区間で推定することを区間推定っていうんですって。
なんか根詰めてたし、今日はおやすみ!宴会じゃ!
・統計的推定について前回はこれまでの知識から、推測へどうやってつなげていけばよいかを復習しました。今回は、どんな感じで推測していけばよいのかを学びました。今回推測するには、ひとつ大事な考え方があるそうで、それは私達が日常の中では、「たくさんのデータの中か
今日は試しにスマホから書いてみる。今日、読者をしてふと思ったんだけど、そういや、このブログって著作権的にどうなんだ?私は今、勉強した内容を復習するためにブログやってるわけだけど、チラッと書いた通り、自分の実績が出るまではアフィとか
タイトルが早くも適当になって参りました。・正規分布で推測できる前記事では「正規分布」について勉強したことを学びましたが、今回はその正規分布の使い方ってか、どんな感じで利用されてるのかって話でした。要は、「扱っているデータが正規分布だとしたら、次に何が起こ
まあこれブログだしね。僕にはそこそこ趣味があります。そんなかでもバイクに乗るのが好きなんですが、最近世の中コロナばかり。当然、移動は自粛せよ、というお達しが出ています。能力の高い起業家の方々とか、それこそ統計マンっぽい人なんかは「いや感染のリスク低いこと
・データの分布にも種類があるっぽい?これまで勉強していた中で、大前提のお話として、データは不確実性のせいで、まちまちな数になるというものがあり、これを「分布」といったわけですが、その中でも、最もポピュラーな分布(種類があるのね)が出てきました。その名も「
統計学についての復習・③(S.Dからみるリスクとリターンについて)
・株に使われるS.D.株でのもうけは、①配当をもらって設ける(企業のもうけの一部を配当される、インカムゲイン)②安い時に買う→高い時に売る(企業の株の価格変動で儲ける、キャピタルゲイン)この二つになるわけですが、キャピタルゲインは平均収益率が重要になる。(株
・統計量についてグラフの欠点として、①受ける印象がまちまちである②グラフを乗せるのにスペースを多く必要とするというものがあるため、これを解決するためのものが統計量。データの特徴を要約した数字のことで、何を要約したいかによっていろいろな統計量が作られている
統計学についての復習・①(大前提のお話~ヒストグラム・度数分析表まで)
・統計学の種類について記述統計…17世紀に起源を求められる手法。一口に言ってしまえば「わかったデータから特長を見つけ出す手法」のこと。人口調査や死亡率の推算なんかが当てはまる。のちに度数分析表やヒストグラムなどの方法論を生み出した。推測統計…一口に言えば「
私、一念発起して勉強を始めてみたは良いものの、統計学や機械学習、ましてやプログラミングなんてずぶの素人…以下であります。よって勉強するにしても、少しでも効率がよい(と思われる)方法がよいなと。無い頭で考えてみた結果、①まず参考書で勉強②ノートに詳細をまと
ある種、このブログの目玉となる(であろう)記事の第1版です。知識ゼロから、一体全体どうやって、でぇたさいえんてぃすとなんて大層なものを目指せばいいんでしょうか…?まずは、自分の目標(ゴール)から考えてみることにしましょう。以前の記事に「データサイエンティス
このブログはなんのために使うのか?っていう記事です。ブログでも始めっか~って思った理由として、主に4つあります。順に挙げていくと、①勉強した内容の備忘録を取りたいからまずこれ。私の勉強遍歴といえば、正直なところ、大学試験で止まっているとも過言ではありません
前記事でなぜデータサイエンティストなのか?というのは別途としましたが、自分の最終目標も含め、ここで整理しておきます。そもそも、パソコンやるなら色々とあるはずなんだろうけど、うちの会社の上司が、今後は製品のデータ等をPowerBIなるものを使って分析、見える化して
どーもありがとうございます。私、生まれてこのかた約30年、文系をやらせてもらっております、かんきっくと申す者です。体型は太目、眼鏡着用野暮ったい感じ、趣味はバイクと読書とゲーム、紙至上主義でした。そんなんですが、この度、データサイエンティストなるものを目指
2020年6月
「ブログリーダー」を活用して、かんきっくさんをフォローしませんか?