【Kaggle挑戦記】Coleridge Initiative コンペ振り返り【#9】
※このページにはColeridgeコンペで良スコアを出す方法は書かれていません。初めて自然言語タスクに挑戦したのでその記録です。 概要 科学論文(英文)の中から、使用しているデータセットについて言及している箇所を抽出してくるというのが本コンペのタスク 論文内でTypoがあればTypoをそのまま抽出する 評価値はJaccard係数ベースのFBetaスコアで評価 9 Distance Measures in Data Scienceで見た名前だったのでちょっと嬉しかった clean_textを通して文字列の規格をそろえて評価させる python def clean_text(txt): retur…
2021/06/24 12:46