chevron_left

メインカテゴリーを選択しなおす

cancel
arrow_drop_down
  • 句読点のない日本語の文章に句読点を挿入するBERTモデルを作る

    概要 Whisperなどで日本語の文字起こしをした後の文章にほとんど句読点が入っておらず、そのまま文字起こし文章を結合すると利用しにくいことがありました。 そこで何らかの手法で句読点を挿入したいと思ったのですが意外と手軽な古典的な手法が見つかりませんでした。このようなタスクはpunctuation restorationと呼ばれるタスクのようです。 ちょっと調べて見つかったのは次のような日本語BERTモデルのMask Fillを逐語的に適応していく方法でした。 qiita.com この手法でもできなくはないのですが思ったほど精度が良くないこと、さらに処理時間が文章の長さに比例してだんだん無視で…

  • 【ベンチマーク編】 Radeon Instinct MI50を買って機械学習用に使ってみる【ROCm】

    まえがき ROCmを試すためにRadeon Instinct MI50を買ってみて、PyTorchで使えるようにセットアップをしたのが前回。 hashicco.hatenablog.com 今回は取ったベンチマークの結果をご紹介! まとめ ROCmは本当にほぼコード変更無しでCUDA用のTensorFlow、PyTorch、Transformerのコードが動く。素晴らしい。 1GPUであればMI50のほうがP40よりも速い。特にFP16を利用する場合は4割くらい早く、結構実用的。 2GPUだとあまりまともな速度が出ない。処理速度に波があるような挙動を示すため、Gradientの集約に時間がかか…

  • 【セットアップ編】Radeon Instinct MI50を買って機械学習用に使ってみる【ROCm】

    まえがき しばらく大きな買い物をしていなかったが、仕事からの現実逃避をしているとふと思う。「ROCm、試してみたいなー」 ということで、ebayを開きめぼしいGPUを探してみたところ、$200以下のお手頃価格で一応ギリギリ最新のROCm 6.0.2にもメンテナンスサポートされているMI50を発見。 送料も考えて2枚まとめて買ってみたので、数回に分けてROCmのインストールから機械学習用の環境構築、以前に買った同価格帯の中古サーバー用GPUの先輩であるNVIDIA P40との比較までを書いていこうと思う。 今回はセットアップ編ということで、取り付けとROCmインストールでrocm-smiが動くと…

arrow_drop_down

ブログリーダー」を活用して、hashiccoさんをフォローしませんか?

ハンドル名
hashiccoさん
ブログタイトル
端の知識の備忘録
フォロー
端の知識の備忘録

にほんブログ村 カテゴリー一覧

商用