まだタイトルない - にほんブログ村

Transformersのモデルキャッシュを別ディスクに移す（Windows編）

こんにちは。 Hugging Face TransformersでローカルでLLMを動かすとき、最初にモデルをダウンロードし、その後はローカルにキャッシュされたモデルを使って実行しますよね。ところが、デフォルトではこのキャッシュ先がOSと同じストレージ（Cドライブなど）になっています。新しいモデルをどんどん試したいときでも、「OSディスクにどんどんデータが溜まるのはちょっと嫌だな…」と感じる人も多いはず。（私は嫌です。）そこで今回は、別途用意しているML用ストレージ（私の場合はFドライブ）に、Transformersのモデルキャッシュを移します。（N番煎じ結論デフォルト設定は~/.ca…

2025/05/06 21:23

AESコンペでやった実験の振り返り

久々にkaggleのコンペをしたので振り返ります。といってもメダルを取ったわけでもないので今回は自分の解法を紹介というわけではなく実験管理について開示します。結構世の中のkagglerが実験数300とか1000とか言ってる話を聞いて、個人的にナンバリングの粒度が気になってるのでまず自分の粒度を開示しようというような感じです。（全然人それぞれでいい問題だけど気になっちゃう性格管理方法まずコンペ期間のメモは基本的にnotionでとってます。テンプレボタンを押すとコンペ用のページが作成されます。こんな感じにメモをとっていく実験実験は絶賛管理方法を模索中です。今回はnotion内のデータ…

2024/07/20 23:23

MLエンジニアへのキャリアチェンジ：情報収集編

こんにちは、今更ですが転職しました！2023年の振り返りでも少し触れましたが、社内SEからAIエンジニアにキャリアチェンジしました。本日は、選考を受ける企業をどのように、どこで知ったのかについてお話ししたいと思います。情報源は大きく分けて2つ、Twitter（≒Kaggle）と転職エージェントになります。 1.twitter Kaggleを通じて知り合った人にお願いして話を聞かせてもらいました。雑に飲み会を企画して話を聞いたり、カジュアル面談という形でお話させてもらったりしました。AI系の仕事といっても、大企業のDX部門のAIチームだったり、プロダクトを作っている企業だったり、SIerのよう…

2024/07/18 23:06

LLM - Detect AI Generated Text 雑に振り返り

こんにちは。先日まで開催されてた"LLM - Detect AI Generated Text"に参加してました。個人の取り組みとしては参加期間も短くディスカッションも追いきれず、公開ノートを弄って終わりでした。久しぶりの機械学習（特にNLP）ということで今コンペはどんなモデルや手法が使われてるのか軽くメモを残しておきます。 ※想像以上に雑なクオリティになってしまいました。ごめんなさい。英語の読解が正しくできてない部分もあるかもしれません。ご承知おきください。 solution毎のメモはコチラに公開してあります。概要 LLMによって生成されたテキストを検出する学生が書いたエッセイとさま…

2024/02/06 14:35

2023年振り返りと2024年の目標

2023年の振り返りをしていきます。この一年は私にとって色々な目標を達成したり、あえて辞める選択をするなど非常に濃密な1年間でした。人間社会としても2022年の暮にChatGPTが登場して、ここまでたった1年ですごい変化が起きており濃密な1年だったと思います。 AtCoder Algorithm 入水 2022年度内の達成を目指してましたが、実力不足であったりDDoSがあったりとでGW後の入水になりました。PAST本上級が途中で終わってたりするので、これの読了とPAST受験、入青をまったり目指すかもしれないです。 AtCoderHeuristic 入水 9/24の回からAHCにも取り組み始めま…

2023/12/28 21:54

AHC027参加記・AHC入水しました!

こんにちは AHC026に参加してきました！ 415th / 3136で水パフォ、無事入水することができました AHC027 課題の確認問題はcontest page参照考察 ※正しくない部分はあると思います各マスの汚れやすさdは1～1000 j-k-1は N=20の時-9から17の値を取る、中心が正のあたりにある正規分布毎ターンsum(dij)-d現在地分スコアが増加する dが大きいマスに移動距離を増やしてまで寄り道することは基本的にスコアの悪化を招く N=40の時は全体で最低でも1600汚れるので、1マスで相殺できないつまり方針としては、Lをなるべく小さくなるようにしつつ、どうし…

2023/12/14 20:00

AHC026参加記

こんにちは AHC026に参加してきました！ 212th/1644で青パフォでした（入水しそこねた・・・・・今回はちょっと手短に振り返ります課題の確認問題はcontest page参照ソリティアと言ってる参加者が多くたしかにそんな感じだと思います。考察取り除くアイテムは200個、操作は5000回できる毎回上に乗ってるものをどかしてから取り除いても400回なので結構余裕 1つ取り除くのに25回移動させられるので制約違反は気にしなくて良さそう目的の数字の上にN個荷物が乗っていたらそれを撤去するにはNの体力消費をすればできる何回に分けてもN消費することは変わらないというのは多分ポイ…

2023/11/05 21:32

AHC025 ふりかえり!

こんにちは、AtCoder Heuristic Contest 025 が 2023-10-14(土) 12:00 ~ 2023-10-22(日) 19:00 で開催されていたので参加してきました暫定ですが結果はこんな感じ。AHC024についで2回目の参加となり、初めての長期コンテストでしたがそれなりにやれたのではないでしょうか・・・？考えたことや考察を時系列に書いていきます。考察があってない可能性もありますがご了承ください。課題の確認詳細はcontest pageで確認ください。与えられたN個のアイテムをD個のグループに分ける Dこのグループの重さが均等になるように分割するそれぞ…

2023/10/22 19:26

【AHC始めました】AHC024参加レポート

こんにちは、そろそろAHCの色も欲しいなーって思ったので参加してきました。基本的に答えがある方が好きなのでAtCoderではこれまでアルゴリズムの方をやってました。今回は参加レポートということで時系列で思ってたこと考えてたことをつらつらと問題の理解隣接関係を崩さないようになるべく少ないマス数で表現する明らかに削っていいマスはわかるけどどうやってプログラムでやればいいかわわからないダウンロードしたツールもよくわからない昨日Introduction to Heuristics Contestで少し予習したときはtester.pyがあったけどそれがない →「あーこれ自分で評価関数的なや…

2023/09/24 22:01

Stable Audio で吹奏楽の楽器をいろいろ生成して遊んだ！

こんにちは音声生成モデル来ましたね。 ja.stability.ai www.stableaudio.com ユーザーガイドをみるとPromptと生成された音声が公開されています。雰囲気や使用楽器、テンポやジャンルが指定できそうな雰囲気です。既にギターやドラム、ベースなどはサンプルであるので、今回は吹奏楽で使われる主要な楽器をpromptに入れてどれくらいそれっぽく作れるのか試してみようと思います Promptは trumpet solo, happy, 156 BPM こんな感じに指定した楽器のソロにhappyを添えてテンポも指定する感じで行きます。 1. トランペット流石に誰でも知…

2023/09/21 22:58

最近いろいろアニメを接種した話

最近、たくさん（当社比）のアニメを視聴しました。都度、思ったことをツイートしていますが、これほどの視聴量は珍しいので、まとめてシェアしていきたいと思います。結論とかは無いです。ぼっち・ざ・ろっくバンドアニメはけいおん至上主義 + キャラデザに惹かれない = 視聴しないだったのですが、たまたま暇だった + 途中まで友人と見てた = まぁ、見るかということで見ました。結論としては比べるものじゃないしどっちもそれぞれいい！最初のライブハウスライブで感極まってないた。これを見てから結束バンドのアルバムを1ヶ月以上ヘビロテした。五等分の花嫁 Huluにrecommendされたので見た。 …

2023/09/17 16:25

ICRの上位解法を眺めた

1st score public 0.14445 private 0.30626 「本当に予想外でした。上位10％に入ることを望んでいましたが、それ以上のことは夢にも思っていませんでした。」 DNNを使用 GBDTは明らかに過学習だったので非採用 greeksは未使用 FEは過学習に繋がった DNN based on Variable Selection Network(論文) 正規化はMinMaxScalerやStandartScalerでなく、8つのニューロンを持つ線形射影最終的に確率を重み付けし直すと、とてもうまくいった。 cvは機能していた 10foldで10-30回学習し、cvを元…

2023/08/15 16:50

yukiCup2023Summerに参加しました

内輪で集まって（オンライン）データ分析コンペで戦いましょう的なものに参加してきました。企画ありがとうございました！結果は15/42でした悔しい。使ったコードはコチラいつもちゃんとデータを見て仮説を立てて実験して結果を見て改善させていきたいっていう理想は持ってるのですが、今回も結果的には思考停止でやっちゃったことが多かったというところが個人的な反省です。考えて取り組んだポイント目的変数の裾が長かったから対数変換するしないほうがよかった +500したら効いたらしい trainデータを価格順に並べて bike_title の1単語目が特徴になりそうだったので抽出した学習データを増や…

2023/07/31 13:05

#15 atmaCup 振り返り

この記事は五等分の花嫁のネタバレを含みますので未見の方はご注意ください。こんにちは atmaCup15がありましたね。結果は82位でした。 atmaCupは課題内容の評判がよく、今回もきっとしっかり課題を理解して有効なアプローチを取った人がスコアを伸ばしてるんじゃないでしょうか？上位を見るとkaggleGMもちゃんといます。それだけにこの結果はシンプルに凹むものがあります。悔しいです・・・自分の上の81個のソリューションが出てくるため、簡単に振り返ります。簡単に振り返り時系列でいきます。最初に基本的なラベルエンコーディングやワンホットエンコーディングをしました。CV1.3999 …

2023/07/23 21:56

kaggle休止中にPyTorchもPyTorch Lightningもメジャーアップデートされてた

こんばんは前回の入水記事沢山の人に読んでいただけました。ありがとうございます。競技プログラミングを半年くらい集中してやってたんですけどその間に機械学習系のライブラリが結構更新されてました。 PyTorchが2になってたり、PyTorch Lightningも2になって、polarsの登場でimportがlightningに変わってたりしてます。（関係あるのかしらんですけど）あとkaggle notebookのpythonのバージョンも3.10になってますね。自分が作ってたテンプレートがここらへんに対応して無いので更新しました。 www.kaggle.com . . . . . . さー…

2023/07/03 22:08

そこらへんの Kaggle Master はどれくらいの時間でAtCoder 水色になれるの？ #001

こんにちは。前回の記事にたくさん訪問いただきありがとうございます。今回はちゃんと色変記事書きます。何をして水色まで行ったか、頑張った感想などが伝わればと思います。また、kaggleだけやってる人がAtCoderを始めるきっかけになったり、その逆にもなったら幸いです。自己紹介 kaggleではteyosan1229として、AtCoderではte1229として活動しています。名前の由来はTales Weaver をしてた頃のハンドルネームから来ています。てょの前はマリだったので、どっちで呼んでも正解です。けいおん！のりっちゃんが好きです。秀でた学歴があるわけでもなく、何か得意なドメイン・…

2023/05/15 22:56

そこらへんの Kaggle Master はどれくらいの時間でAtCoder 水色になれるの？ #000

2023/05/16 追記ちゃんとした色変記事を書きました teyoblog.hatenablog.com お久しぶりです。前回の更新から135日ほど経っていたみたいです。労力のいる作業なのでしょうがないですね笑さて、タイトルにあるようにそこらへんにいるKaggle MasterがゼロからAtCoder水色を目指すとどれくらい時間がかかるのか？結論から言うと8ヶ月かかりました（半年くらいでなれたらちょっとドヤ顔できるかなと思ってたんですけどね。。。。）本当はこう進んだり、こう進むつもりだった水色になったときに公開するために、勉強をしながらリアルタイムで日記的なものをつけていたので…

2023/05/14 01:46

2022年振り返りと2023年の目標

お世話になっております。 4か月ぶりの更新になってしまいました。ここ最近機械学習コンペから離れているので更新が滞っていたのですが、2022年を振り返るといろいろあったのでここで振り返ろうと思います。なお、今年のそのいろいろは忘れたくない（あと感染症的にあえてやろうとも思わない）ので忘年会は0です。誘われてないわけじゃないんだからね。 Kaggle commpetition masterになった 1月に終わったpetfinderコンペで（チーム）金を取得し、そのあとjigsawコンペで（ソロ）銀を取得でき、始めた当初の目標であったkaggle masterになることができました。 kaggler…

2022/12/29 19:03

『推薦システム実践入門』の写経で躓いた所メモ

こんにちは『推薦システム実践入門』を写経していて本の通り動かない部分があったため、メモとして残します。今回は5章のIMFでimplicitを使う部分各ライブラリのバージョン numpy:1.21.6 implicit:0.5.2 scipy:1.7.3 リンク github.com github.com 本題本のコード # モデルの初期化 model = implicit.als.AlternatingLeastSquares( factors=factors, iterations=n_epochs, calculate_training_loss=True, random_stat…

2022/08/22 10:18

ヨーロッパ旅行記⑧[プラハ観光2]

はじめにこの旅行記は昔したヨーロッパ旅行の記録です。 1週間ほどかけてドイツ、チェコ、オーストリアを周遊しました。できる限り自分が見たい旅行記に近づけるようにがんばって書いています。ここが良い、これがほしいありましたらご意見待ってます。バックナンバーヨーロッパ旅行記①[出発～フランクフルト] ヨーロッパ旅行記②[フランクフルト～ローテンブルク～フュッセン] ヨーロッパ旅行記③[ノイシュバンシュタイン城～フュッセン市街地] ヨーロッパ旅行記④[ミュンヘン] ヨーロッパ旅行記⑤[チェスキークロムロフ] ヨーロッパ旅行記⑥[プラハ] ヨーロッパ旅行記⑦[プラハ観光] 今回の旅程お久しぶりで…

2022/08/14 21:29

【Kaggle挑戦記】AI4Code振り返り【#15】

こんにちは先日終了したkaggleのAI4Codeに参加してました。やったことのないタスクだったためアプローチなどを知るために参加しました。少しでも自分のアイデアを使ったサブができたら良かったのですがローカルでスコアの再現が全く取れなかったりだらけきってしまったことにより、公開ノートのサブをする程度で終わってしまいました。今回は自分が見た範囲のアプローチをメモとして残して、コンペ中うまくいかなかった部分を最後にちょこっとかきます。コンペ内容 kaggle notebookに公開されてるノートのセルの正しい並び順を予測する正しい順序に並んでるCodeセルのどの位置にmarkdownセル…

2022/08/14 17:32

機械学習コンペ（テーブルデータ）をする時の特徴量管理を考える #1

kaggleなどでのテーブルコンペの公開ノートブックではそのノートですべてを完結させるという意味でもノート内で特徴量を作成していることが多いです。しかし、長期間のコンペになると実験数は増えるし、処理に時間がかかる特徴量を使うケースも増えてきます。実験のたびに特徴量を計算するのは地球にやさしくない。。。この問題に対するシンプルな対策は作った特徴量をファイルで保存しておいて読み取るだけにすることだと思います。具体的な方法は kaggle 特徴量管理でググれば素晴らしい記事がいくつも出て来ると思います。今回は特徴量毎に数値特徴量かカテゴリ特徴量かの情報も欲しくなったのでその情報も一緒に管…

2022/06/09 19:30

大気中の汚染物質濃度の予測に挑戦しよう！に参加してきました

SIGNATEで開催されていたソニーグループ合同データ分析コンペティション（for Recruiting）に参加してきました。結果は835人中84位で上位10%くらいでしょうか。20位までsony製品の賞品が出るコンペだったので商品に手が届かず悔しいです。内容待機観測データ等を用いてpm25の値を予測するコンペです。細かい概要とデータについてはコンペサイトに記載されています。 trainとtestは都市ごとに分かれていること、3年分だが計測に欠損はたくさんある（1000日分くらいデータが有る都市もあれば殆どない都市もある)ことが特徴に思いました取り組みと解法前処理 Trainから測…

2022/06/05 22:27

Kaggle Days Championship Tokyo で優勝しました！

こんにちは先日行われた Kaggle Days Championship Tokyoに参加してきました。参加はyukiさん、kutoさん、sqrt4kaidoさんとの4人チームです。結果は83チーム中で優勝することができました。おそらくこれでバルセロナのFINALイベントに参加できることになると思います。スペインは行ったことのない国でとても楽しみです。（無事現地に行けたらいいなちょっとタスクに触れるソリューションはコチラに、私が使ったノートはコチラに公開されています。今回のタスクはD1からD10のそれぞれ内容が異なるデータテーブルが与えられ、そのテーブル内の欠損値を埋めるというも…

2022/04/27 19:57

3月はカメラについて勉強しました

こんにちは youtubeなどいろいろなものに逃げていたとはいえこの2年は機械学習メインでやっていて色々と他に勉強してみたいものは棚に上げていました。一応一段落したので3月は趣味の一つのカメラについて少し勉強しました。勉強のテーマ焦点距離の違いを知って新しいレンズを買う構図について知る読んだ本写真のことが全部わかる本センス&知識ゼロからの写真のはじめかた、教えます。 (上達やくそくBOOK)作者:中原一雄インプレスAmazon まずは初学者向けっぽい本。イメージセンサーの素子の並び方の話なんかはあとから読む本にはなかったのでこの本を読んだから学べたことになります。ベイヤー配列は緑…

2022/04/04 22:50

KaggleDays in Mumbai に参加してきました！

こんにちは昨夜行われた KaggleDays x Z by HP Championship Meetup in Mumbai に参加してきました。ありがたい英語の講演を聞いてから、直前にタスクが発表され、4時間で戦うコンペです。今回はNLPが題材でした。モチベーションとしては機械学習タスクに取り組むときのアジリティが低い自負があったため短期間コンペで練習したいというところからです。結果 public 41st => private 42nd / 87 感想と取り組みタイムラインまずは4時間のうちに簡単なサブとやってみたいアイデア1つを実装してサブで来たのは良かったです。ただ、Jigsa…

2022/03/11 11:03

Kaggle Competitions Master になりました！

先日のJigsawコンペの銀メダルが確定して Kaggle Competitions Master になることができました。 twitterではたくさんのいいねとお祝いの言葉をいただき、承認欲求が満たされました。ありがとうございます。これを目標にずっと頑張ってきたことなので報告的なポエムを書こうと思います。 ※以下、competitionsは省略します。 kaggleの戦績は下記です。運よく最初のコンペで銅メダルが取れて、鳥コンペでもとれたので意外といけるのか？というところから全然メダルが取れなくなり、ここ半年でいい流れのままmasterになったという流れですね。時系列で振り返る各々の…

2022/02/21 22:36

【Kaggle挑戦記】Jigsawコンペ4 に参加してきました。【#14】

こんにちは。 2021年11月8日から2022年2月7日まで開催されていたJigsaw Rate Severity of Toxic Commentsに参加してきました。前回のPetコンペが終わって、コードの提出とリフレッシュをしてから始めたので2週間位の取り組みでした。結果は2,329チーム中の41位で銀メダルを獲得することができました。またこの結果よりcompetitions master に昇格することが出来ました！また別でポエム書くと思います。それでは振り返りに入ります。コンペ概要/データ・評価方法 wikipediaのコメントの有害コメントの深刻度の評価をする。関連コンペ…

2022/02/09 22:04

【Kaggle挑戦記】PetFinderコンペに参加してきました。【#13】

こんにちは。 2021年9月23日から2022年1月14日まで開催されていたPetFinder.my - Pawpularity Contestに参加してきました。結果は3,537チーム中の2位で金メダルを獲得することができました。今回は自分が取り組んだことや考えたことについて少し書いていこうと思います。今回の2位という結果に関してはチームメンバーにつれてきてもらったと思っています。ソリューションはkaggleのディスカッションに投稿されてますのでそちらをご参照ください。 tkmさんが本コンペの動画も上げていらっしゃいますので是非ご視聴ください。 www.youtube.com コンペ概…

2022/01/23 21:14

2021年振り返りと2022年の目標

こんにちは絶賛コンペ期間中ということもあり、雑にですが今年を振り返り、来年の目標を立てておこうと思います。昨年の振り返りと今年の目標はこちら。 teyoblog.hatenablog.com kaggle Competitions Master ポモドーロテクニック平日に2、休日に4する kaggle用のメモを年末に公開するこんな目標を立てていたみたいです（完全に忘れてた。勉強は機械学習始めてから累計2000時間になりましたが、ポモドーロの継続と公開できるメモはありません・・・。ふりかえり今年の戦績はこんな感じ、GLR、Coleridgeはドロップしました。ここ（圧力）ちょっと…

2021/12/31 13:27

【Kaggle挑戦記】シミュレーションコンペ Lux AIに参加してきました。【#12】

こんにちは。 2021年8月16日から2021年12月6日まで開催されていた Lux AI Challengeに参加してきました。結果についてはこれからの2週間の評価期間を経て確定となりますが、初めてのシミュレーションコンペということでいけて銅メダルか？というラインなので今回は解法振り返りというより取り組みを振り返るようなポエムを書いていこうと思います。参加した動機まずはこちらの実際のゲームの動画？を見てみてください。かわいいですね。なので参加することにしました。概要昼30ターン、夜10ターンを9サイクル360ターンが試合時間最後に街をたくさん残していたほうが勝ちワーカーは資…

2021/12/12 22:08

【Kaggle】Ventilatorコンペ上位解法から学ぶ

こんにちは！ Lux AI何もわからなくて辛いてょです。まんまと見た目の可愛さに釣られました。本記事はKaggle Advent Calendar 20215日目の記事です。タイトル通り先日終了したkaggleのGoogle Brain - Ventilator Pressure Predictionコンペの上位解法をまとめます。内容は下記です Brainコンペの上位解法をまとめる実際に動かしてみてコンペ期間の自分のベストモデルとの比較をするやらないこと PIDコントローラーの逆解析については今回は扱いません 1位 ①simple LSTM(LB0.1209) Task - regre…

2021/12/05 00:00

【Kaggle挑戦記】肺の圧力コンペ銀メダル相当振り返り【#11】

こんにちは kaggleで9/23から11/4の期間で開催されていた『Google Brain -Ventilator Pressure Prediction』というコンペティションに参加してきました。4名の方とチームを組み、結果としては2,659チーム中76位、銀メダル相当のスコアを出すことができました。今回はコンペ期間中に学べたことや取り組んだこと書いていきます。コンペ概要/背景人工呼吸器のシミュレーションデータから肺にかかる圧力を予測するというタスク人工呼吸は臨床医が必要になる。COVID-19のパンデミック時にはその数に限界が来ていた人工呼吸器を制御する新しい方法を開発するに…

2021/11/09 18:53

【Kaggle挑戦記】MLB コンペ 31th 銀メダルでした【#10】

こんにちは本日MLBコンペのprivateリーダーボードが確定されて無事初めての銀メダルを手にすることができました。銀メダルはコンペティションマスターになる条件の1枚ですのでやっと一歩目を踏み出せたなという思いです。取組内容取組内容に関してはすでに記事になっているので下記記事を参考にしてください。 teyoblog.hatenablog.com ちょっとだけ考察本コンペは締切が7/31で、8/1以降のデータをprivate testデータとしてhostが頑張ってデータを作って評価を行う形式でした。実際には10日おきくらいでそれまでの10日分、20日分、30日分のデータでスコアの計算…

2021/09/15 22:10

【30日チャレンジ】早起き【2021年8月】

こんにちは、以前から気になってた30日チャレンジというものを8月2日から今日までの30日でやってみました。 30日チャレンジとは www.ted.com 動画は3分くらいなので見たほうが早いですが、30日だけなにかに挑戦してみれば30日チャレンジです。半年くらい前ツイッターで見かけてずっと気になっていて、ふとこれ挑戦したいなと思うことがあったので始めてみました。何をしたか早起きをしました。Youtubeで早起きに関する動画*1 を見たのがきっかけです。副効果も大きいと思ったのでこれに決めました。余談ですが動画の女の子の目と声が結構好き。取り組み方目標時間は5時半に起きる（そのために…

2021/08/31 19:56

【PyTorch Lightning】checkpointをロードするのに躓いたことメモ

こんにちは最近PyTorch Lightningで学習をし始めてcallbackなどの活用で任意の時点でのチェックポイントを保存できるようになりました。 save_weights_only=Trueと設定したの今まで通りpure pythonで学習済み重みをLoadして推論できると思っていたのですが、どうもその認識はあっていなかったようで苦労しました。今回は学習済みの重みで予測するところまで進めようと思います。 ※ちなみにsave_weights_onlyのTrueとFalseは全く違う設定のようです結論結論としては下記の2つの方法ができそうだなと思いました。学習時のLightning…

2021/08/26 12:24

データサイエンス100本ノックを完走した【Google Colab】

こんにちはコツコツと進めてたデータサイエンス100本ノックですが遂に完走できました。今回は下記サイトを参考に（というか提供されてるnoteをもらって）Google Colabで全て行いました。興味ある方はノートパソコンでも全てできます。一部ライブラリのバージョンの差か何かでdatetimeの処理が違っていた気がしますがそこら編は私のnoteを貼っておくのでご参考ください。 qiita.com 下記私が100問解いたノートです。一部コメントなどが入ってます。 colab.research.google.com 感想というのも大げさですがこの100本ノックのおかげでMLBコンペでdatafra…

2021/08/25 20:15

【未完】PyTorch LightningとWeights & Biasesを使った画像タスクパイプラインを作成し始めた

こんにちは 2021年の夏の連休も2021年に引き続きほぼ予定がなかったので、何らかのコンペに充てる気満々だったのですが、いろんな要因で時間を捧げるコンペはありませんでした。コンペはしてなかったのですが、PyTorch LightningとWeights & Biases を使った画像タスクのパイプライン作成をしていました。いままではそういった物は持ってなくて最初のサブまでとても時間がかかっていたので、パイプラインをいじって学習して推論して初サブまでが早くなればいいと思っています。今回は作ったものを載せつつ自分用のメモを書いていこうと思います。間違いや改善点ありましたらご指摘ください。 C…

2021/08/17 12:32

【Kaggle挑戦記】MLB コンペ振り返り【#10】

こんにちは。 2021/6/10-2021/7/31 の期間で開催されていたMLB Player Digital Engagement Forecastingというコンペに参加してきました。取組期間は6/29-8/1の約一ヶ月です。結果は2021/9/15に決まるのでまだどうなったかはわかりません。今回はコンペ中に気になったこととそれに対してやったこと（殆どは何もわからんで対策できず）について書きます。また、他の参加者がどう考えてたのか、本質は何だったのか聞く機会があればいいなーと思っています。コンペページ MLB Player Digital Engagement Forecastin…

2021/08/05 08:17

【Kaggle挑戦記】Coleridge Initiative コンペ振り返り【#9】

※このページにはColeridgeコンペで良スコアを出す方法は書かれていません。初めて自然言語タスクに挑戦したのでその記録です。概要科学論文（英文）の中から、使用しているデータセットについて言及している箇所を抽出してくるというのが本コンペのタスク論文内でTypoがあればTypoをそのまま抽出する評価値はJaccard係数ベースのFBetaスコアで評価 9 Distance Measures in Data Scienceで見た名前だったのでちょっと嬉しかった clean_textを通して文字列の規格をそろえて評価させる python def clean_text(txt): retur…

2021/06/24 12:46

【Kaggle挑戦記】鳥コンペ2(BirdCLEF 2021)銅メダル振り返り【#8】

こんにちは先日終了した鳥コンペ2に参加してきました。結果はpublic41位からprivate66位で目標としていた銀メダル以上を取ることはできませんでした。本コンペではTakamichi Todaさんと、shinmura0さんのチームに途中から仲間にしてもらいチームでの取り組みとなりました。この記事では自分がやってたCNN部分の取組内容を書いていきます。自分がCNNで進めていた理由は過去の鳥コンペと、鳥蛙コンペでの上位solutionで使われており、十分戦えると判断したためです。SEDについて全然わからないのでもっと積極的に教えてもらいに行けばよかったと後悔している・・・。コンペ概…

2021/06/05 15:48

ヨーロッパ旅行記⑦[プラハ観光]

はじめにこの旅行記は昔したヨーロッパ旅行の記録です。 1週間ほどかけてドイツ、チェコ、オーストリアを周遊しました。できる限り自分が見たい旅行記に近づけるようにがんばって書いています。ここが良い、これがほしいありましたらご意見待ってます。バックナンバーヨーロッパ旅行記①[出発～フランクフルト] ヨーロッパ旅行記②[フランクフルト～ローテンブルク～フュッセン] ヨーロッパ旅行記③[ノイシュバンシュタイン城～フュッセン市街地] ヨーロッパ旅行記④[ミュンヘン] ヨーロッパ旅行記⑤[チェスキークロムロフ] ヨーロッパ旅行記⑥[プラハ] 今回の旅程今回は5日目、チェコのプラハ観光です。宿泊地…

2021/04/10 22:24

【Kaggle挑戦記】バスケコンペでメダル拾えるかと思ったらそんな甘い話なかった【#7】

こんにちは！役立たずてよです！自分で役立たずとは言いつつも、「まぁそこまででもないっしょ！」と思っていました。でも、今回のバスケコンペで................... こんにちは、kaggleのバスケコンペに参加してきました。 March Machine Learning Mania 2021 - NCAAM March Machine Learning Mania 2021 - NCAAW NCAAはNational Collegiate Athletic Associationの略で全米大学体育協会という意味です。そのなかのバスケットボール男子/女子の大会の結果を予測するという…

2021/04/06 20:58

【本読んだ】機械学習のエッセンス

機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)作者:加藤公一発売日: 2018/09/21メディア: 単行本こんにちはその道の人？がプッシュしていた1ので、購入して写経しながら読みました。下記に自分の感想とは書きますが、この本の良さについてはプッシュされてる記事を読むほうが参考になります。（断言）内容学習の前に Pythonの基本機械学習に必要な数学 Pythonによる数値計算とデータの可視化機械学習のアルゴリズム最終的にPythonで機械学習アルゴリズムを実装していくため、Pythonの基本的な部分を勉強する…

2021/03/29 19:52

【本読んだ】Kaggleコンペティションチャレンジブック

こんにちは昨年末に発売された「Kaggleコンペティションチャレンジブック」を買って、スタバとかでゆっくり読み進めてようやく読み終わりました。 Kaggleコンペティションチャレンジブック作者:Jung Kweon Woo発売日: 2020/12/28メディア: 単行本（ソフトカバー）実際にkaggleでメダルを取ったコードの解説を読める本この本の特徴は過去のkaggleコンペティションを4つピックアップして、EDA、baselineモデルの解説をじっくり行い、入賞者が公開したコードを元に筆者が解説を加えながら紐解いていくというところにあります。また、テーブル、音声、画像と分野が広…

2021/03/25 20:15

【atmaCup】初めてatmaCupに参加してきました。

こんにちは 3/5-3/13の期間で開催されていたatmaCupという機械学習コンペに初めて参加してきました。 public119->private143(↓24)/298（サブしてる人数）と結果は振るわなかったですがとてもいい経験になりました。コンペサイト→#10 [初心者歓迎!] atmaCup コンペ関係者の皆様、このような機会を設けていただきありがとうございます。入賞者の方々、おめでとうございます。参加者の方々、お疲れさまでした！なぜ参加したか atmaCupについては#6の頃から認知はしていました。なぜ参加してなかったかというと、kaggleのコンペマスターを目指していたから…

2021/03/13 20:04

分析コンペ勉強会で勉強してきた。 #33dsoc

※ほぼ日記です。こんにちは、面白そうな勉強会があったので聴講してきました。1 何れの発表も発表者様の考えがうまく言語化されていてとても勉強になると同時に、考えを言語化する力の凄さを感じました。具体的には下記のような能力についてでしょうか。考えて、試して、振り返って、力にすることの大切さを改めて学ぶことが出来ました。課題の中にある課題を理解し、分解し、置換して事例を探したり解決する力自分とトッププレイヤーの力の差をうまく測ることコンペとして（機械学習で解決する対象として）適切かどうか審判する力多用なリソースを使いこなる力ノイズに立ち向かう力より効果的にコンペのスコアを上げる力メ…

2021/03/02 21:30

Cassavaコンペ中に学んだことや自分用メモ

こんにちは今回はCassavaコンペ期間中に導入したことや、自分用のメモを書きます。 HydraとMLflow Trackingの導入下記サイトにお世話になりました。公式ドキュメント小さく始めて大きく育てるMLOps2020 ハイパラ管理のすすめ -ハイパーパラメータをHydra+MLflowで管理しよう- Hydraで始めるハイパラ管理 Python: MLflow Tracking を使ってみる小さくMLOpsを始めてみようと言うことで今回は2つのツールを入れてみました。鳥コンペの頃に参考にしたnotebookの影響でもともとyamlでコンフィグを書いていたのでHydraに関して…

2021/02/21 20:09

【Kaggle挑戦記】Cassavaコンペ振り返り（本編）【#6】

こんにちは今回は「Cassava Leaf Disease Classification」というコンペに挑戦しました。 Cassava Leaf Disease Classification 結果はpublic891位からshake downしてprivate1303位という大惨敗です。まず、どんな目標を立てて取り組んでどうなっかに軽く触れて、コンペへの取組内容と敗北者ソリューションを載せます。それではよろしくおねがいします。このコンペでの目標本コンペは運要素が強いと言われていましたが、やることはシンプルな画像分類で評価値も正解率だったためとっつきやすいです。なので、画像タスクの基本的…

2021/02/20 21:06

ヨーロッパ旅行記⑥[プラハ]

はじめにこの旅行記は昔したヨーロッパ旅行の記録です。 1週間ほどかけてドイツ、チェコ、オーストリアを周遊しました。できる限り自分が見たい旅行記に近づけるようにがんばって書いています。ここが良い、これがほしいありましたらご意見待ってます。バックナンバーヨーロッパ旅行記①[出発～フランクフルト] ヨーロッパ旅行記②[フランクフルト～ローテンブルク～フュッセン] ヨーロッパ旅行記③[ノイシュバンシュタイン城～フュッセン市街地] ヨーロッパ旅行記④[ミュンヘン] ヨーロッパ旅行記⑤[チェスキークロムロフ] 今回の旅程前回はチェスキークロムロフを観光しバスでチェコに向かうところまででした。今回…

2021/01/17 17:24

ヨーロッパ旅行記⑤[チェスキークロムロフ]

はじめにこんにちは。この旅行記は昔したヨーロッパ旅行の記録です。 1週間ほどかけてドイツ、チェコ、オーストリアを周遊しました。できる限り自分が見たい旅行記に近づけるようにがんばって書いています。ここが良い、これがほしいありましたらご意見待ってます。バックナンバーヨーロッパ旅行記①[出発～フランクフルト] ヨーロッパ旅行記②[フランクフルト～ローテンブルク～フュッセン] ヨーロッパ旅行記③[ノイシュバンシュタイン城～フュッセン市街地] ヨーロッパ旅行記④[ミュンヘン] 4日目の旅程前回はドイツミュンヘンを観光し、ホステルで宿泊するところまででした。今回から4日目に入ります。電車と…

2021/01/09 21:02

【kaggle】NFLのTop solutionsメモ

NFLコンペのソリューションを読みました。ソリューション一覧はココにまとめられています。上位の傾向として2ステージに分けていて1ステージ目に物体検知を行ってから2ステージ目で画像分類をする流れが多く見られました。impactを選び切るのをどの段階で行うかが別れていました。また、コンペ中そこまで理解できていなかったのですが、正解ラベル1つに付き予測は1つしか正解にならないため学習時には正ラベルの範囲を増やすが、sub時には同一衝突は1レコードになるようなpostprocessingが必要だったみたいです。せっかく手元にまとめたのでここに供養します。英語力も物体検知のドメイン知識も不足してい…

2021/01/08 21:52

【Kaggle挑戦記】NLFコンペ振り返り【#5】

こんにちは今回は「NFL 1st and Future - Impact Detection」というコンペに挑戦しました。 NFL 1st and Future - Impact Detection 結果はpublic94位（銅）→private104位（メダルなし）/459でメダル獲得ならずでした。ワンチャン銀とか取れちゃうんじゃないかと期待して参加してみましたが全くそんな事はありませんでした。調子に乗ってました全力で謝罪します。 Object detectionという分野に関して小麦コンペで触ったときには何もわからなかったので、今回は基本的な部分を学びながらコンペに取り組みました。本記…

2021/01/05 17:40

2020年第53週進捗確認(2020年完走！)

こんにちは第53週の振り返りをしていきます第53週の進捗確認今週の実績実績の累計計画値勉強 30h39m 1202h02m 1060h 音楽 4h10m 175h10m 265h 追加で立てた1200時間の目標はなんとか達成楽器はサボり気味のまま終わってしまいました(´・ω・`) 年間の月別も並べてみました。GWとか長期休暇を始めkaggleコンペに熱中してるときが多いですね。つまりkaggleコンペやってる方が良いのでは・・・？終わりに 1年間ほぼ毎週実績を振り返ることで1年の速さを感じた振り返り以外何らかのアウトプットが全く出来なかったのは反省 2021年は習字で振り返る…

2021/01/04 20:21

2020年振り返りと2021年の目標

はじめに 2020年も終わるということで、2020年の振り返りと2021年の目標を宣言していきます。 2020年の振り返り目標の達成具合年初に立てた目標は下記 2019年の振り返りと2020年の目標 - まだタイトルない内容結果一言健康プランク(1分*3セット)を毎日未達リングフィットも最近出来てない体脂肪率15% 未達 17%くらい暮らし整理整頓できている部屋未達 IoT家電の導入未達 IFTTT使う未達 Slackの活用達成 kaggleで使った音楽 250時間未達 175時間※12/30時点勉強 1000時間達成 1188時間※12/30時点統計…

2020/12/30 20:34

2020年第52週進捗確認

こんにちは第52週の振り返りをしていきます第52週の進捗確認今週の実績実績の累計計画値勉強 18h29m 1171h23m 1040h 音楽 3h10m 171h00m 260h 今年最後にNFLコンペに参加してみました一週間チャレンジになりますがオブジェクトディテクション乗り会が少しでもできるようにがんばります

2020/12/29 08:52

スタンフォード式最高の睡眠自分用メモ

こんにちは数年前にこの本を買って読んで、また今年記事にしようとメモを取りながら読んでずっと放置されていました。 2021年に持ち越したくないのでここでそのメモ供養しておきます。出てくる用語？ 2種類の睡眠中の状態レム睡眠 REM=Rapid Eye Movement（急速眼球運動）身体は休息しているが、脳が活動している状態記憶の整理や定着が行われる夢を見る状態ノンレム睡眠 non-REM 脳が眠っている状態 2種類の体温深部体温体の内部の温度、日中高くて夜間が低い体表面温手足の温度は逆で昼に低くて夜間高い朝より夜のほうが体温が高いと思います何をもって最高の睡眠とするの…

2020/12/27 12:00

2020年第51週進捗確認

こんにちは第51週の振り返りをしていきます第51週の進捗確認今週の実績実績の累計計画値勉強 19h22m 1152h54m 1020h 音楽 4h30m 171h00m 255h ボーナスタイムサボりすぎてる人間

2020/12/21 22:54

どんな人がkaggleを始めて4ヶ月でCompetitions Expertになったのか

はじめにこの記事はKaggle Advent Calendar 2020 の19日目の記事です。 18日目は fam_taroさんのコンペのために LambdaPC を購入してみたお話でした。電力の確認という工程が印象的でした。自分のGPUはGTX1070なのでそろそろメモリの大きいGPUとか考えたくなります。 20日目はupuraさんのWeekly Kaggle News 1周年です。（後でリンク貼ります）この場を借りて、おめでとうございます！簡単な自己紹介と概要 teyosan1229という名前で今年の6月からkaggleをはじめました。銅メダルを2枚獲得したのでCompetition…

2020/12/19 00:00

2020年第50週進捗確認

こんにちは第50週の振り返りをしていきます第48,49週の進捗確認今週の実績実績の累計計画値勉強 12h41m 1133h32m 1000h 音楽 2h00m 166h30m 250h ちょっと忙しかったプラス自分の怠惰でなかなか勉強ができませんでした。年賀状の準備以外とくに用事もないのでしっかり睡眠取りながら頑張るぞいあとがき新幹線で英語の本読むと寝落ちしてしまうことがわかりました

2020/12/14 19:49

2020年第48,49週進捗確認

こんにちはまたまた1週間サボってました。2週間分の実績を・・・第48,49週の進捗確認今週の実績実績の累計計画値勉強 43h55m 1120h51m 980h 音楽 5h35m 164h30m 245h 2週間計は40時間超えてるので引き続き楽器もかなり地味にやってますがあまり納得出来てはいないあとがきコンペ終わっておつかれということで若干の季節遅れで京都に遊びに行ってきました。公共交通機関、宿泊施設、観光スポット、どこをとっても感染予防はとられていて、観光客も意識高く観光できていたのが印象的でした。地域共通クーポン（電子）も使用しましたが、結構使いやすいなぁという印象。

2020/12/07 20:02

2020年中に読みきりたい積読の紹介

こんにちは kaggleのコンペも終わりましてダレるタイミングですが、やることやって終わりたい。宣言することで自分にプレッシャーを与えていきたいということで今回は積まれてる本（電子含め）を紹介したいと思います。 ①独学プログラマー独学プログラマー Python言語の基本から仕事のやり方まで作者:コーリー・アルソフ発売日: 2018/02/24メディア: 単行本髭のおじさんがやけに印象に残っていたのと、評判が良さそうだったので移動時用に買った本。まだ半分くらいしか読んでないです。12月はパソコンが使えない状況になることも多そうなのでそのときに読み切ろうと思います。 ②機械学習・深層学習による…

2020/12/02 22:12

【Kaggle挑戦記】MoAコンペ振り返り【#4】

こんにちは kaggle登録して4回目のコンペに参加してきました。 Mechanisms of Action (MoA) Prediction 結果はpublic619位→private204位/4384でメダルなしです。 publicで一回銅圏内までいけましたが最終的にはメダル圏外フィニッシュからのshakedown...ブレンドだけしてる公開ノートが上にあったので流石にshakedownはしないかと思ったのですが残念無念。コンペ概要 ※自分のコンペ用のメモから抜粋間違った部分ございましたら指摘ください MoA（作用機序）とは薬理学における作用機序とは、薬剤がその薬理学的効果を発揮する…

2020/12/01 23:25

2020年第46,47週進捗確認

こんにちは先週はkaggleのコーディングしたくてたまらなかったので、まとめて振り返りをしていきます第45週の進捗確認今週の実績実績の累計計画値勉強 60h36m 1076h56m 940h 音楽 8h45m 158h55m 235h 次の目標としてたてた1200もいけるかも？ 12月は少し忙しいのでMoAに注ぎきりたいところです。あとがき分析力の足りなさを感じています・・・

2020/11/23 10:52

2020年第45週進捗確認

こんにちは第45週の振り返りをしていきます第45週の進捗確認今週の実績実績の累計計画値勉強 33h24m 1016h20m 900h 音楽 2h55m 150h10m 225h 無事1000時間達成！！！あとがき後2ヶ月がんばります

2020/11/09 22:53

2020年の目標（のひとつ）1000時間勉強する。を達成！

こんにちは今年始まりに立てた目標である勉強1000時間ですが、この度達成しましたので報告させていただきます！ ] 目標立てた記事はこれ teyoblog.hatenablog.com 年末にまた2020年を振り返るので今回はうすく・・・主な取組内容 python G検定合格統計検定2級合格 kaggle（銅メダル2枚） kaggleは現在進行系プラス次の目標に絡んでます。活用したものストップウォッチ特に説明は必要ないですね。スマホに触らなければいけない機会を減らすために買いました。意思が弱いのでたまにスマホ触ってしまってたんですけど、それでも多少は効果があったと思います。 Stu…

2020/11/05 21:30

2020年第44週進捗確認

こんにちは第44週の振り返りをしていきます第44週の進捗確認今週の実績実績の累計計画値勉強 31h36m 982h56m 880h 音楽 3h15m 147h15m 220h NLPでやってみたいこともあるためNLP本での学習も少ししました kaggleはちょっと伸び悩みかもしれないです引き続きがんばりますあとがき今週で1000時間達成できそうです。巨人も優勝したし、坂本キャプテンも2000安打近いので全部揃ったらいっぱい宴しようと思ってます。これがモチベーション

2020/11/02 23:37

2020年第43週進捗確認

こんにちは第43週の振り返りをしていきます第43週の進捗確認今週の実績実績の累計計画値勉強 22h3m 951h20m 860h 音楽 2h40m 144h00m 215h kaggleでいろんな方のnoteを参考にしながら自分のnoteをつくっています。自分のnoteにする際に少し書き方を合わせたりするようにしてたら少しずつプログラミング能力が上がってきた気がしてます。あとがきまだまだがんばるぞ～～～～～

2020/10/26 22:52

2020年第42週進捗確認

こんにちは第42週の振り返りをしていきます第42週の進捗確認今週の実績実績の累計計画値勉強 22h58m 929h17m 840h 音楽 3h30m 137h50m 210h kaggleは声をかけていただいてチームを組みました。チームを組んで1週間活動しましたが、自分にはやる気を上げる事ができる要素の一つのようですおそらく今年最後のコンペ？（12月はRiiidでなく2020年のやり残しをする予定なので）だと思うので最後は笑いたい！あとがきサンデーうぇぶりで名探偵コナンをほぼ最新まで追いつけました。最近のマンガアプリってすごいんですね。

2020/10/19 21:19

2020年第41週進捗確認

こんにちは第41週の振り返りをしていきます第41週の進捗確認今週の実績実績の累計計画値勉強 21h16m 906h19m 820h 音楽 4h00m 137h50m 205h 基本的に勉強時間はkaggle関連です。今回のコンペはなるべく手を動かしながら勉強をすることに重きをおいてるのであまりスコアを気にせず一つづつ実装して動かしてをしています。最終的に銀メダルを狙いたいです（銅ではマスターに近づけないためあとがき音楽ですが週のノルマ5時間で、6時間はやりたいのですがなかなかいけませんね。最近は寝る前のブルーライト社団の時間帯にゴシップガールをみながら基礎練をしてます。

2020/10/12 20:08

2020年第40週進捗確認

こんにちは第40週の振り返りをしていきます第40週の進捗確認今週の実績実績の累計計画値勉強 23h49m 885h03m 800h 音楽 4h30m 133h50m 200h MOAはじめました。よろしくおねがいします。あとがき目標1000時間まで後100時間何処までつめれるかなー

2020/10/05 23:33

【本読んだ】暮らしてみたい世界のかわいい街

こんにちは謎の物欲で買った『暮らしてみたい世界の可愛い街』という写真集を読んだのですが、何個か印象に残った街があったので共有します。暮らしてみたい世界のかわいい街発売日: 2019/08/30メディア: 単行本（ソフトカバー） ①ハルシュタット（オーストリア）オーストリアにある街でウィーンから少し遠く約4時間、ザルツブルクからは約3時間ですが、電車で行けるので意外と生きやすいかもしれませんね。湖畔の民家も風景を映えさせていて印象的でした。 ②バッハラッハ（ドイツ） 4317940によるPixabayからの画像本に乗っているような写真はなかったので下記検索結果から見ると伝わるかもしれな…

2020/09/30 19:38

2020年第39週進捗確認

こんにちは第39週の振り返りをしていきます第39週の進捗確認今週の実績実績の累計計画値勉強 24h04m 861h14m 780h 音楽 4h10m 129h20m 195h コンペ終わって一息ということでゼロつく3をやってましたそろそろやる気出すために手を動かす何かをしてみようと思いますあとがきもうすぐ第4クオーターに入って1000時間やってどれくらいになれたかって言うのも現れてくるので、ラストスパートを生活リズムと集中を大切に頑張っていきたいです。

2020/09/28 20:49

ヨーロッパ旅行記④[ミュンヘン]

はじめにこんにちは。この旅行記は昔したヨーロッパ旅行の記録です。 1週間ほどかけてドイツ、チェコ、オーストリアを周遊しました。できる限り自分が見たい旅行記に近づけるようにがんばって書いています。ここが良い、これがほしいありましたらご意見待ってます。バックナンバーヨーロッパ旅行記①[出発～フランクフルト] ヨーロッパ旅行記②[フランクフルト～ローテンブルク～フュッセン] ヨーロッパ旅行記③[ノイシュバンシュタイン城～フュッセン市街地] 今回の旅程引き続き三日目です。前回はドイツフュッセン駅についたところで終わりました。今回は電車でミュンヘン駅に移動し、市内観光、宿泊するところまでで…

2020/09/27 16:25

【本読んだ】ゼロから作るDeep Learning ❸フレームワーク編

こんにちは kaggleのコンペが一区切りということで今回は発売即購入してそのままだったゼロつく3を読みました。ゼロから作るDeep Learning ❸ ―フレームワーク編作者:斎藤康毅発売日: 2020/04/20メディア: 単行本（ソフトカバー）今回は（超）簡単な紹介と感想を書きます。概要今回の本はゼロから作るDeepLearningシリーズの第三冊目でフレームワーク編ということで、そういうことです。 pytorchのようなdefine by run形式のフレームワークの小規模のもの全60STEPで0から作る構成になってます。最後の方にCNNとRNNとLSTMにも触れてると言う…

2020/09/26 23:33

【kaggle挑戦記】鳥コンペに取り組んで、チラシ裏

こんにちは、先日の取組内容の記事には想定の数倍の人にアクセスいただきありがとうございました。今回は取り組みながら感じたことを中心に書いていきます。 teyoblog.hatenablog.com 1ヶ月をどう過ごしたか感想や反省の前にまずはコンペに取り組んでいた期間に何をしていたかを記します。 baselineのnotebookを理解する Discussionを全部読む optimizer変えたり細かい設定をいじりながらkaggleのGPUとsubmit枠を無駄にしないように学習をすすめる少しずつ実験をしていく（ここでbaseline突破） inference時にでノイズをする testに…

2020/09/21 19:55

2020年第38週進捗確認

こんにちは第38週の振り返りをしていきます第38週の進捗確認今週の実績実績の累計計画値勉強 19h31m 837h10m 760h 音楽 -h--m 125h10m 190h kaggleの鳥コンペが終了しました、取組内容は記事になってます。感想をまた書きますちょっと目指す姿の解像度が荒いことにより取組内容がぼやぼやしてきています。難しいあとがきコンペおつかれということで久々に外にお酒を飲みに行きました。焼き鳥美味しかったです。

2020/09/21 13:25

【Kaggle挑戦記】鳥コンペ銅メダル取組内容【#3】

こんにちは kaggle登録して3回目のコンペに参加してきました。 Cornell Birdcall Identification 結果はpublic53位→private127位/1395で上位10%の銅メダルフィニッシュです。 publicが銀圏内だっただけにshake downでの銅は悔しいものがありますが、上位解放と比べると工夫ができてないのでまだまだ精進が必要です。さて、今回コンペについて、取組内容と感想を書きたいのですが、一緒の投稿にすると見にくくなると思うので今回は取組内容について振り返っていきます。違う畑の人や、興味のある人に、こういうことをやるんだなってことが伝われば幸い…

2020/09/17 23:45

2020年第37週進捗確認

こんにちは第37週の振り返りをしていきます第37週の進捗確認今週の実績実績の累計計画値勉強 25h04m 817h39m 740h 音楽 9h15m 111h55m 185h 鳥コンペわからねぇって言いながら1週間過ごしました。あとはローカルの環境とも戦ったのでメモリ買ってdocker若しくはクラウドも考えなきゃいかんですね学習時間も安定しないのでこのことも色々学ぶ必要がありそうあとがきインプットをうまくまとめられてないです・・・

2020/09/15 05:57

sndfile.dll' has no function, constant or global variable named 'sf_wchar_open'の直し方自分用メモ

こんにちは。先日、pythonでmp3をwavに変換したいということで色々戦いました。 ffmpegをインストールしてもうまく動かずに後先考えずにいろいろ試した結果タイトルのようなエラーが直せなくなりました。諦めても良かったのですがもともと動いてた学習用のプログラムすら動かなくなったのでこれはまずいと言うことでこれまた色々試した結果直りましたので、今回は最終的に直った方法を自分用にメモとして残します。ここで言う"直った"は学習用コードを動くようにし、mp3->wavへの変換は動かない状態で、諦めるということです。はじめにはじめてのトラブルシューティングの記事なのでお手柔らかにお願いしま…

2020/09/12 11:46

2020年第36週進捗確認

こんにちは第36週の振り返りをしていきます第36週の進捗確認今週の実績実績の累計計画値勉強 24h48m 792h35m 720h 音楽 4h15m 111h55m 180h kaggleコンペに夢中になってると20時間はわりと苦なくやっちゃいますね小噺 kaggleを初めてついに英語論文を読みました。shaperというサイトとDeepL(アプリ)を駆使したのですが思っていたより苦労することなく読めました。ただ、最新論文を時間かけて読むより先にすることがあると思うのそこら編は改めて何を優先するかは考えようと思います。

2020/09/07 20:35

2020年第35週進捗確認

こんにちは第35週の振り返りをしていきます第35週の進捗確認今週の実績実績の累計計画値勉強 22h05m 767h47m 700h 音楽 2h25m 111h55m 175h 8月も終わりということは2020年も2/3が終わりですね。いい調子で1000時間は達成できそうです今週はローカル環境でも機械学習の学習をできるようにしたことが進歩です。次はgithubでコードを共有、バージョン管理できるようにしたい所楽器の時間はどうも増えないですねあとがき CPUクーラー良いやつ買うよりも寝てるとき、外出してるときに学習回すことが多いのでサーキュレーターで良いのではと思いましてサーキ…

2020/08/31 19:49

ローカルマシンでpytorch(cuda)を使った学習がを改善したい

2020/8/29追記タスクバーの見る部分が違っていました。確認した所cudaでの演算は出来ていました。学習速度が早くなったわけではないので引き続き少し調べていきますこんにちはローカルマシンでDeepLearningの学習を回せるようになりたいと思って環境の整備をしました。（クラウドは次のステップと思っている）実際に動かしてみるとどうやらマシンに適した動きをしてないように見え、もっと早く学習させられるのではと感じました。本記事ではpytorchのパラメータを調べたり調整しながらより早く学習できるように試行錯誤をしていきたいと思います。下記、注意事項です筆者が初学者であることまだ未…

2020/08/28 22:00

2020年第33-34週進捗確認

こんにちは先週は更新をし忘れてたので2週分、33-34周目の復習をします。第33-34週の進捗確認今週の実績実績の累計計画値勉強 70h30m 745h42m 680h 音楽 8h50m 109h30m 170h 時間としてはお盆休みも自粛ということで鳥コンペをみっちりやっていました。野球見て、リングフィットして、楽器弾いて（もっと弾くつもりだった）、勉強して充実していました。最近やっとkaggleに対する集中度が上がってきて来た気がします。あとがきいま取り組んでる鳥コンペが終わった後4連休あるけど甘やかすかどうかっていうところです。

2020/08/24 23:23

Trelloの更新情報をSlackに通知させるまでの設定メモ

こんにちは kaggleなんですけど初めてチームを組んで取り組んでいます。いまはslackを使って情報共有をしているのですが、ブレストのようなメモを管理するには向いてないように感じたので試験的にTrelloを導入してみることにしました。導入すると行っても更新情報の通知はSlackに来たほうが楽だと思うのでその設定を自分用にメモとして本記事に残します。まぁslackも初心者なので使いようによっては・・・ということもあるかもしれないですね目標 Trelloの更新情報をSlackの任意のチャンネルに通知させる今回やったこと Trelloにチームを作成 Slack側にTrelloアプリを追加し、…

2020/08/14 11:20

2020年第32週進捗確認

こんにちは 32周目の復習をします。第32週の進捗確認今週の実績実績の累計計画値勉強 13h00m 675h12m 640h 音楽 1h15m 100h40m 160h 今週から本格的にkaggleで鳥コンペに手を付け始めましたまたしてもDeepLearningを使うやつで、かつPyTorchが多いので流石にPytorchの本とか買って勉強しなきゃいけない気がしているあとがきここに書くネタ募集します。

2020/08/10 21:03

【Kaggle】2回目のコンペ感想【小麦コンペ】

はじめに本記事では、テーブルコンペ（時系列データ）に1回だけ参加したことがある機械学習初心者が小麦コンペに約2週間だけ取り組んだことについて色々書きます。結果としてはnotebookをそのままsubmitしてプライベート上位50%です。 kaggleをやったことない人、これからやってみようとしてる人にむけて「素人が2週間取り組むとこんな感じだよ」という雰囲気になると思います。コンペ中にとったメモをもとに書きますが、正しい認識をもとににかけてるとも限らないので、信じすぎないよう、指摘等お願いします。参加登録を7/24にしたもうこの時点で2週間きっているのですが、主目的としては画像コンペ…

2020/08/05 21:28

2020年第31週進捗確認

こんにちは 30日勉強してない理由を思い出せなかったのでツイッターをさかのぼったらソシャゲでした。記憶力も体外ですがtwitter以外に遡れる媒体があっても良いのかもしれません。それでは第31週の復習を第31週の進捗確認今週の実績実績の累計計画値勉強 18h32m 662h12m 620h 音楽 2h55m 99h25m 155h どうでもいい話ですが勉強の実績が20時間ぐらいずれていたので本週より直しました。小麦コンペに入っていったけどだめでした。

2020/08/03 21:10

2020年第29-30週進捗確認

こんにちは先週の更新を忘れていました。2週間経つの早くないですか？第29-30週の進捗確認今週の実績実績の累計計画値勉強 42h14m 619h46m 600h 音楽 7h55m 96h30m 150h 相変わらず集中力が足りない助けて

2020/07/27 23:21

Colabでツイートデータを取得してスプレッドシートに読み書きする

こんにちはこの記事ではGoogle ColaboratoryからTwitterAPIを使用してツイートを取得しGoogleスプレットシートに保存（追記も）する方法を紹介します。初めてのコードを共有する記事なので緊張しています。お手柔らかにお願いします。参考サイト qiita.com qiita.com qiita.com twitterAPI取得まずはtwitter APIを申請して承認してもらいAPIキーを用意します。ググって上位に出てくるサイトを元に作業したらすぐに承認してもらえました。（申請内容は例文でなく正直に分析の勉強する旨を書きました。 tweet取得部分 KEYS = …

2020/07/24 12:07

毎日お風呂にお湯を張って入浴したらどれほど光熱費が増えるのか実験した

ある日、シャワー中にバスタブに栓をしたところ結構な湯量がたまりました。これって洗面器さえあれば毎日お湯張っても光熱費増えないんじゃね...? こんにちは突然ですが、湯に浸かることって健康に良いみたいな話を聞きますよね。なぜいいのか、どのような効果があるのかはここでは言及せず体にいいことを前提として、タイトルの実験をした話をします。（何故しようと思ったかは上記）環境まずはお風呂の環境ですが、家のシャワーはハンドルふたつを駆使して温度調節をする必要があります。シャワーヘッドで節水するのもいいかと思いましたが栓のタイプ的にそのままつけてシャワー側でお湯を止めたりするのは給湯器に悪いという情報…

2020/07/23 16:58

【本読んだ】FINAL FANTASY XV の人工知能 - ゲームAIから見える未来

こんにちは今回はこの本を紹介しつつ、自分用のメモを後半に載せます。旅行中に何らかの勉強になる本を読めないかということでこの本を買って読みました。 FINAL FANTASY XV の人工知能 - ゲームAIから見える未来作者:株式会社スクウェア・エニックス『FFXV』AIチーム発売日: 2019/06/04メディア: 大型本読んだ感想としてはそもそも期待してはいなかったが機械学習関係の話も含まれていてまだまだ凄いゲームが生まれるというワクワクを感じた FFXVにはたくさんのAIが使われており、種類は多くてもその目的は一つ、プレイヤーを没入させて楽しませるここまでユーザビリティを考えて…

2020/07/21 18:00

パソコンのパーツを変えたので機械学習とFFのベンチマークを実施

こんにちはパソコンの故障からパーツ交換をしたので、新しい構成の紹介と何個か実験してみようと思います。パソコンの構成部品旧新マザーボード ASUS ROG Strix B350-F Gaming ASUS TUF GAMING B550-PLUS CPU Ryzen7 1700 Ryzen5 3600 GPU MSI GeForce GTX 1070 - メモリー Corsair DDR4-2666 (8GB×2) - SSD SAMSUNG 960 EVO M.2(500GB) - HDD TOSHIBA(3TB) - 電源 Corsair RM650x - CPUをパワーアップさ…

2020/07/19 14:33

【本読んだ】機械学習のための特徴量エンジニアリング

こんにちはパソコンが壊れてKaggleも出来なかったので、この本を買って勉強しました。ちょっと求めてた内容とは違ったのですが、学ぶこととか不足してるものはたくさんあったので自分用にまとめます。自分用なので何となくすでに知ってることとかは省略するため粒度がまばらになると思います。機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)作者:Alice Zheng,Amanda Casari発売日: 2019/02/23メディア: 単行本（ソフトカバー） 1章機械学習パイプラインデータにはノイズや欠損値はつきもの上手くデータから学習するため…

2020/07/18 17:29

2020年第27-28週進捗確認

こんにちはパソコンが復活したので早速2週間分振り返ります。第27-28週の進捗確認今週の実績実績の累計計画値勉強 38h56m 577h32m 540h 音楽 6h10m 88h35m 135h 勉強は2週間で40時間を切ってしまったので反省少しやることがあるとなかなか勉強時間を確保できないのでもっと管理能力上げたい音楽はやはりオーディオインターフェースつないでやらないとやる気にならない部分があるこの2週間は本を読んで勉強をしてたけど、プログラム系はやはり動かしながらやりたいのでやはりパソコンは命買った本 ①機械学習のための特徴量エンジニアリング ―その原理とPythonに…

2020/07/13 21:07

2020年上半期の振り返り

こんにちは 2020年も下半期に入ったので上半期を振り返ります。年始に立てた目標の振り返り健康プランク(1分*3セット)を毎日する。週3､4回の頻度で継続中体脂肪率15% 17.5%から16.8%に微減 GWからリングフィット復帰下記記事の『モデルプログラム4：ガチンコダイエットコース』を実践中 note.com 暮らし整理整頓の行き届いた部屋づくり一個台を作成エフェクターボードを置けて、本をしまえるので結構重宝しています IoT家電の導入スマート睡眠パッドを購入睡眠スコアがわかって良い。また記事にしたい買い物 IFTTT使う未使用。スマート睡眠パッドが連携できるらしい…

2020/07/06 18:00

【Kaggle】初コンペの感想と反省会

はじめにこんにちは先日初めてのKaggleをどう取り組んだかをまとめましたが、今回は感想よりの部分を書きます。反省、感じたこと以下、反省と感想をつらつらと・・・写経において1つ1つのコードが読めず1つのnotebookを写経し、理解することにかなり時間がかかった特徴量エンジニアリングをする過程で今のデータがどうなっているのか頭の中で把握し続けることが出来なかった（めっちゃノートにまとめたモデルのトレーニング中の時間の活用ができなかった reduce_mem_usageのようなよく使う便利な関数は自分用のTIPSにまとめていきたい学ぶことが本当に多い、情報の取捨選択をして上手にメ…

2020/07/05 11:39

【Kaggle】初参加のコンペで銅メダル獲得したので振り返る【M5コンペ】

はじめにこんにちは Kaggleに登録して初めてのコンペが終了して無事銅メダルを獲得できました。今回は1か月どのように取り組んだのかをメモしながら過ごしていたのでそのメモベースに振り返りをしていきます。いろいろメモをしていてどこまで載せればいいのか判断つけれていないので見苦しい記事になっていたらすみません。それでは参加した5/31からスタートします。 5/31~ 開催中のコンペに参加始める前に読んだ「スタートブック」内でまずは開催中（残り期間1か月くらい）のコンペに参加することがすすめられていたため、今回Kaggleを始めていきなり開催中のコンペに参加することにしました。選んだコンペはM…

2020/07/04 23:43

2020年第26週進捗確認

こんにちは 2020年第26週進捗確認週の振り返りをします。第26週の進捗確認今週の実績実績の累計計画値勉強 23h54m 562h30m 520h 音楽 3h50m 86h15m 130h 土曜日にパソコン壊れた対応で勉強ができませんでしたが、何とか日曜日にすこしだけ盛り返せました。初めてのkaggleコンペがもうすぐ終わるのでブログをうまくまとめたいですコラムパソコンが壊れた件について少しチラシ裏前日いつも通りパソコンの電源を落として、朝スイッチを押したらパソコンが付きませんでした。症状ビープ音はなるモニター出力がされないマウスも光らないこの段階から自分でいろい…

2020/06/29 18:29

2020年第25週進捗確認

こんにちは 2020年第25週進捗確認週の振り返りをします。第25週の進捗確認今週の実績実績の累計計画値勉強 27h41m 538h36m 500h 音楽 6h10m 82h25m 125h ・先週は金土日と野球を見つつもノルマの勉強時間を達成できました。今週からは週6日試合があるのでうまいことやらなあかんですね。・さて、25週終わって計画値が500になりました。折り返しです。GWに詰め込んだおかげでなんとか38時間プラスで来れてるので、後半も頑張って年末には少し余裕が作れたらなと思います。・今週は音楽も少しだけ多めにできました。こっちはだいぶショートしてるけど少しずつ頑張って…

2020/06/22 19:35