chevron_left

メインカテゴリーを選択しなおす

cancel
arrow_drop_down
  • 【Rのジミ〜な小技シリーズ】空リストの作成とリスト操作、それと空ベクトルを使ったベクトル結合とデータフレーム結合のトピックスを扱う

    またもや、ジミーなトピックであるが、空リストlist()と空ベクトルc()について取り上げてみる。 こういうジミーな技術の積み重ねがスキル向上に繋がるんだと思うんけどね。 今回の内容 空リストlist()からリストを作成する 空ベクトルc()からベクトルを作成する 空ベクトルc()からデータフレームを作成する %%EF%BC%88%E3%83%91%E3%82%A4%E3%83%97%E6%BC%94%E7%AE%97%E5%AD%90%E3%81%82%E3%82%8B%E3%81%84%E3%81%AF%E5%8D%98%E3%81%AB%E3%83%91%E3%82%A4%E3%83%9…

  • 【Rのジミ〜な小技シリーズ】データ解析の前処理で悩まされるデータ重複の問題を扱ってみた件

    本記事は、 skume.hatenablog.com の続編である。 さて、これからデータ解析を始めようかという時に、まずやることは該当データのクオリティチェック(品質評価)だろう。 クオリティチェックと言っても、いろいろな方法・考え方があって、データによって様々である。 今回は、最も基本である、データ重複の問題を扱ってみる。 今回の内容 練習データの準備 ベクトル内で、データの重複があるかどうか?・重複をどう扱うか? 2つのベクトル間で、データの重複があるかどうか?・重複をどう扱うか? データフレーム内で、データの重複があるかどうか?・重複をどう扱うか? まとめ 参考資料 練習データの準備 …

  • バーチャルスライドスキャナー画像(.ndpi)からオリジナルTIFFイメージを取り出す際のTips〜ギガバイトイメージの画像解析入門〜

    今回、バーチャルスライドスキャナー画像(.ndpi)の取り扱い方を取り上げる。 .ndpiという画像フォーマットは、浜松ホトニクス社が提供するHamamatsu formatの1つである。 NDPIファイルは「独自メタデータを持つシングルファイルTIFF-likeな形式」であり、一般的によく使われるTIFFとかPNGと比べて、なかなか扱いにくい形式である。 また、TIFF-like形式というのは実際、Compress TIFF 形式で格納されていて、ImageJではその形式に対応したプラグインを導入する必要がある。 今回の内容 NDPIToolsのセットアップ NDPIテストファイルのダウンロ…

  • R言語で実行するSudachiPyによる日本語形態素解析

    SudachiPyは、日本語形態素解析器SudachiのPython版である。 今回、R/RStudio上でのSudachiPyの実行例を概説する。 個人的には、RユーザーにとってPythonパッケージがR環境上で実行できると、いろいろと良いのでは考えている*1。 例の如く、HomeBrewでPythonの環境構築を行う。 skume.hatenablog.com 今回の内容 実行環境 SudachiPyのデフォルト・インストール Sudachi 辞書 fullの設定 R上でのコマンドライン版sudachipyの実行 R上でのPythonパッケージ版sudachipyの実行 自作関数Sudac…

arrow_drop_down

ブログリーダー」を活用して、skさんをフォローしませんか?

ハンドル名
skさん
ブログタイトル
京橋のバイオインフォマティシャンの日常
フォロー
京橋のバイオインフォマティシャンの日常

にほんブログ村 カテゴリー一覧

商用