searchカテゴリー選択
chevron_left

カテゴリーを選択しなおす

cancel
プロフィール
PROFILE

あさくらさんのプロフィール

住所
未設定
出身
未設定

自由文未設定

ブログタイトル
BioTech ラボ・ノート
ブログURL
https://biotech-lab.org/
ブログ紹介文
オープンサイエンスとしてのライフサイエンス研究の情報や、研究で使えるIT技術情報、がん治療の最新研究、生活・研究に役立つソフトウェアなどを公開しています。
更新頻度(1年)

20回 / 48日(平均2.9回/週)

ブログ村参加:2020/08/29

本日のランキング(IN)
読者になる

新機能の「ブログリーダー」を活用して、あさくらさんの読者になりませんか?

ハンドル名
あさくらさん
ブログタイトル
BioTech ラボ・ノート
更新頻度
20回 / 48日(平均2.9回/週)
読者になる
BioTech ラボ・ノート

あさくらさんの新着記事

1件〜30件

  • 1000人ゲノムプロジェクトからデータを取得する

    1000人ゲノムプロジェクト(1000 Genomes Project)は、異なる民族のヒトのゲノムサンプルを少なくとも1000人分以上解析し、遺伝的多様性のカタログを公開することを目指したプロジェクトで、2008年に開始されました。このプロジェクトはIGSRによって管理されている国際プロジェクトで、日本も含めた世界の26の集団からの3202人のゲノムデータが解析されています。 ここでは1000人

  • FASTQ形式の配列データの品質をPythonでチェックしてみる【Python】

    NGSから配列データがFASTQ形式で得られたら、まずはそのクォリティをチェックする必要があります。FastQCというアプリケーションで品質チェック・管理を行うことが一般的ですが、ここではPythonのプログラムでFastQCの品質チェックを再現してみましょう。実際に手を動かして試してみれば、FastQCの品質チェックがよく理解できて、FASTQ形式のデータの理解も深まると思います。 バイオインフ

  • 実験データの外れ値を統計学的に判別する方法

    実験の測定データにはばらつきが生じてしまいますが、測定ミスや何らかの外部的な要因でどう考えてもおかしい値が出ることがあります。しかし、そのようなデータを明確な基準もなく除外してしまっては、恣意的なデータとなってしまい、データの信頼性を落とす結果となってしまいます。もちろん、断りなくデータを除外してしまってはデータの改ざんになってしまいます。 そのようなときに、外れ値を統計的に判定する方法を持ってい

  • 確率・オッズ・ロジットの関係からオッズ比、ロジスティック回帰モデルまで

    確率からオッズやロジットといった様々な概念が生み出されています。それらを活用することで医療統計の分野などでおなじみのロジスティック回帰モデルも説明できます。でも、オッズやロジットとロジスティック回帰モデルの関係を理解できていますか?そもそも、ロジスティック回帰モデルの「ロジスティック」ってどういう意味ですか? ここではそれらの疑問を解いていきましょう! 確率とオッズ・ロジット 確率pに対して、その

  • DataFrameから条件を指定してデータを抽出する方法(ブールインデックス参照)【Python】

    pandasのDataFrameで条件式を用いてデータの抽出を行う方法を説明します。データの抽出にはいくつかの方法がありますが、ここでは基本となるブールインデックス参照を用いた方法を解説していきます。 開発環境 pandas 1.0.3Python 3.7.7 ブールインデックス参照とは? DataFrameの要素を抽出する際に、添え字に要素数と同じ数のbool型のリストでインデックスを指定すると

  • DataFrameから条件を指定してデータを抽出する方法(queryメソッド)【Python】

    pandasのDataFrameで条件式を用いてデータの抽出を行う方法を説明します。データの抽出にはいくつかの方法がありますが、ここでは最もスマートに抽出できるqueryメソッドを用いた方法を解説します。 開発環境 pandas 1.0.3Python 3.7.7 DataFrameから条件式でデータを抽出する方法 DataFrameのqueryメソッドに抽出条件を文字列として指定することで、条件

  • DataFrame / Series からリストに変換する【Python】

    データ解析にはDataFrameやSeriesが非常に有用ですが、場合によっては最も単純なデータ形式であるリスト形式が必要になる場面もあります。DataFrameからリストとして取得したいデータをSeriesとして抽出してから、Seriesのto_listメソッドを用いることでリストに変換できます。 開発環境 pandas 1.0.3Python 3.7.7 DataFrameの行・列をリストに変

  • 正規母集団の母平均の区間推定を行う【Python】

    ある集団の平均値を求めるときに、そのすべてを調べるのは困難な場合は一部のサンプルの平均値を求めて元の集団の平均値を求めることがよく行われます。今回はそのような場合の、一部のサンプルの平均値(=標本平均)から元の集団の平均値(=母平均)の範囲を推定する方法をPythonを用いて説明します。 開発環境 Python 3.7.7scipy 1.4.1 具体的な状況を考えてみる ― 全社員の身長の平均値は

  • 箱ひげ図を描く【Python】

    箱ひげ図を用いることでデータのばらつきを分かりやすく表現することが可能になります。ここでは、Pythonのmatplotlibを用いて箱ひげ図を描く方法を説明します。 開発環境 matplotlib 3.1.3Python 3.7.7 箱ひげ図とは? 箱ひげ図は与えられたデータ系列から四分位数と呼ばれる以下の5つの統計量を可視化したグラフです。 最小値25パーセンタイル(第1四分位点)中央値(第2

  • OneNoteを使った書籍の電子化 ― 紙の本のよさをそのままに

    紙の本には紙の本の良さがありますが、やはり電子化してスマートな生活を送りたいですよね。そんな方のために紙の本の良さを保ちつつ本を電子化する方法をご紹介します。あくまでも自分が個人的にやっている方法を紹介するだけなので、もっといいやり方もあるかもしれませんが、少しでも役に立つ部分があれば幸いです。 紙の本の良さと電子化のデメリット 紙の本の良さは何でしょうか?いろいろあるとは思いますが、個人的には以

  • DigitalOceanでマインクラフト統合版のサーバーを立てる

    クラウドサーバーを使ってマインクラフトのサーバーを立てれば、マルチプレイで家族や友達などと一緒に、各々が好きな時間に遊ぶことができます。公式のREALMSでも同じことができますが、自分でクラウドサーバーを立てればサーバーの負荷状態によって構成を最適化でき、柔軟なサーバー運営することができます。 特に、DigitalOceanではマインクラフト用のサーバー(BE版、Java版)があらかじめ用意されて

  • DigitalOceanのインスタンスにDocker環境を構築する

    クラウドサーバーのDigitalOceanにDockerの環境を構築する方法を説明していきます。クラウドサーバーなら初期費用なしで、使用時間と必要な性能に応じて無駄なく柔軟な料金プランで運用することができるのが特徴です。最初は実質的に2カ月無料で使うことができるので、お試しで使ってみることもできます。 DigitalOceanの料金プラン DigitalOceanの料金プランは以下のようになってい

  • eLabFTWのデータを移行する

    eLabFTWはバックアップ・復元を用いることで、データの移行を行うことができます。例えば、次のような場合には非常に有用です。 最初はお試しでWindowsのローカル環境でeLabFTWの運用を始めて、軌道に乗ったところで途中からクラウドに移行するクラウドでeLabFTWを運用していたが、プロジェクトが終了したのでeLabFTWをローカル環境に移行してアーカイブしておく このように自分のデータを自

  • DigitalOceanのクラウドサーバーにSSHで接続する

    DigitalOceanのクラウドサーバーにSSHで接続する方法を説明します。DegitalOceanではSSHを使わなくてもブラウザ上のコンソールからもサーバーにアクセスできますが、ブラウザのコンソールでは制限事項もあり、またSSHの方が安全性が高いことから、SSHを用いた接続が推奨されています。 SSH接続による認証 SSHとは? SSH接続はあらかじめ公開鍵と秘密鍵のキーペアを作成しておき、

  • eLabFTWのアップデート

    eLabFTWは頻繁に新しいバージョンがリリースされてバグ修正や機能の追加などが行われています。新しいバージョンが出たら早めにアップデートをしておきましょう。 現在のバージョンとアップデートの確認方法 左下のSYSADMIN PANELをクリックして、システム管理者用の設定画面を開くと現在のバージョンと最新バージョンが表示され、アップデートがある場合は次のように表示されます。 eLabFTWの最新

  • eLabFTWのデータ構造とバックアップ・復元

    実験データはラボの魂とも呼べるもので、それを失った時の損失は計り知れません。なので、必ずバックアップを取っておきましょう。バックアップを取ることができるというのは紙の実験ノートにはないデジタルデータの強みでもあります。 なお、eLabFTWのバックアップ方法は公式マニュアルにも記載されていますので、こちらもご参照ください。 How to backup (公式マニュアル) eLabFTWのデータ構造

  • eLabFTWの高度な設定を行う(タイムゾーンの変更)

    eLabFTWの基本的な設定は管理画面から変更することができますが、中には設定ファイルを直接いじらないと変更できない設定項目もあります。ここではそのような項目の設定変更方法として以下のようなものを説明していきます。 タイムゾーンの変更 eLabFTWのインストール方法ごとの設定ファイルの変更方法の違い eLabFTWのインストール方法(Dockerを使うかどうか、elabctlを使うかどうか、Li

  • SMTP2GOを用いたメールサーバーの設定

    SMTP2GOはレンタルのメール送信サーバーで、メールの件数が月1000通以下なら無料で使うことができます。 SMTP2GOを用いて自作のIoT機器からメールを送信したりなどもできるようになります。また、オープンソースの電子ラボノートeLabFTWでも、通知やパスワードリセット用にメールサーバーの設定が必要ですが、SMTP2GOの使用が推奨されています。 SMTP2GOのアカウントを作成する メー

  • オープンソースの電子ラボノートeLabFTWの概要と導入方法

    電子ラボノートは各社から様々なものが出ていますが、「大規模企業・研究機関向けのパッケージ商品」「個人向け / 小規模施設向けのクラウドサービス」「オープンソースプロジェクト」などがあります。ここでは、オープンソースの電子ラボノートであるeLabFTWについて紹介していきます。 eLabFTWとは? eLabFTWは電子ラボノートのオープンソースプロジェクトで、現在も活発に開発が続けられています。も

  • クラウド上で電子ラボノートeLabFTWを実行する

    クラウド上でeLabFTWを実行して、どこからでもアクセスできるようにしましょう。まずはeLabFTWを動かすためのクラウドサービスと契約する必要がありますが、ここではコストパフォーマンスと信頼性のバランスに優れたDigitalOceanを使ってみます。DigitalOceanはeLabFTWのマニュアルでも推奨されていて、1カ月あたり約500円程度の予算でクラウドサーバーを運用することができます

  • Windowsのローカル環境で電子ラボノートeLabFTWを実行する(検証用)

    オープンソースで開発が進んでいる電子ラボノートのeLabFTWですが、基本的にはサーバー上にインストールして実行する必要があります。しかし、「ちょっと試してみたい」という場合にはサーバーまで準備するのは気が引けますよね?そのようなときは、Windowsのローカル環境でeLabFTWの実行環境を整えてみましょう。 eLabFTW とは? eLabFTW はオープンソースで開発が進められている電子ラボ

  • 主要ながんゲノムデータベース

    現在ではがんゲノム情報も網羅的に集積されるようになっており、それを公共データベースから誰でも閲覧し、解析することができるようになっています。 ここでは、主ながんゲノムデータベースについて紹介します。 ICGC Data Portal URL : https://dcc.icgc.org/ ICGC Data Portal とは? ICGC(国際がんゲノムコンソーシアム)によるがんゲノムプロジェクト

  • BNCT研究の現況と最新情報(NCT letter)が公開されています【BNCT】

    日本中性子捕捉療法学会よりBNCT研究の現況と最新情報について詳細に書かれたNCT letter 第7号が公表されました。BNCTに関心のある方はぜひ一度ご覧ください。 NCT letter 第7号 保険診療が開始されて間もないBNCTですが、これまでの臨床の話や今後の新たな加速器開発の話題、そしてBNCT研究の今後のことなど非常に新鮮な情報がたくさん詰め込まれています。さらに、少し前に話題になっ

  • サンプルデータセット – scikit-learn①【Python】

    機械学習モジュールのscikit-learnではサンプルデータが用意されており、それをDataFrameとして取り込むこともできます。機械学習のためのサンプルとして使うことはもちろんのこと、DataFrameとして取得すれば様々な解析に用いることができます。ここでは、scikit-learnで提供されているデータセットについて解説を行います。 開発環境 Python 3.7.7scikit-lea

  • 散布図を描く【Python】

    散布図は各データの項目の値を縦軸と横軸の2つに対応させてドットをプロットしていくことで、縦軸・横軸の2次元情報の相関関係やデータの分布を可視化するための図です。また、縦軸・横軸だけでなく、ドットの色もデータの値によって変化させることで3つの項目の関係(3次元情報)を可視化することもできます。ここでは、Pythonのmatplotlibを用いて散布図を描く方法を説明します。 開発環境 matplot

  • COVID-19 オープンデータを可視化する①【Python】

    各地のCOVID-19の感染者動向に関するオープンデータは東京都のGitHubリポジトリからフォークして提供されています。各地のデータは類似したフォーマットで提供されているので、そのデータを可視化してみましょう。ここでは、大阪府のデータを例にして説明していきます。 マスコミの情報を鵜呑みにするのではなく、自分でデータを解析してマスコミの情報を検証できる力を身につけましょう。 開発環境 matplo

  • その日のページごとのPVやAdSense収益を見る! – アプリ版Googleアナリティクス

    ブログを始めたばかりだと、どのページをどのくらいの人が見てくれているのかが気になりますよね?もちろん、Googleアナリティクスでページごとのアクセス数を調べられますが、Web版では地味に深い階層にあって調べにくいんですよね。しかも、Web版ではデフォルトでは今日の現時点でのアクセスは表示されませんしね。 でも実は、アプリ版を使えば簡単にその日のページごとのPVを表示できるんです!ついでにAdSe

  • 折れ線グラフを描く【Python】

    ここでは、最も基本となる折れ線グラフを描く方法を説明します。 開発環境 matplotlib 3.1.3Pandas 1.0.3Python 3.7.7 基本的な折れ線グラフの描画 Axesオブジェクトのplotメソッドで折れ線グラフを描画できます。(pyplotスタイルの場合は、pyplotのplot関数を用います) 基本的な使い方①:plot(y) 折れ線グラフの縦軸(Y軸)の系列をリストやS

  • 近似曲線と決定係数(R2)の算出【Python】

    データ解析において、標本値から近似曲線を作成することや、そこで求めた近似曲線(モデル式)がどの程度当てはまっているかを示す決定係数(\(R^2\))を求めることは必須の技術です。Excelを使えば非常に簡単に近似曲線と決定係数(\(R^2\))を求めることできますが、Pythonを使う場合はどのようにすればよいのでしょうか。Pythonでは近似曲線を求めるための方法がいくつか用意されており、さらに

  • 技術ブログ開設6か月の経過報告 ― 技術ブログのリアル

    2020年2月5日にこのブログを開始して6か月経過したので、現状を報告します。これから技術ブログを立ち上げようとしている方がいれば、その参考になれば幸いです。 アクセス数・PVの推移 1日当たりの平均ユーザー数と平均PVは以下の通りです。 おかげさまで多くの方に閲覧していただき、何とか月間2000PVに達したという状態です。もちろん、月間2000PVという数字がすごいのかどうかというと...、まあ

カテゴリー一覧
商用