chevron_left

メインカテゴリーを選択しなおす

cancel
研究開発 http://blog.livedoor.jp/tak_tak0/

シリコンバレーベンチャーみたいに深い科学技術を事業化したいです。

「深い技術」をやっています

TAK
フォロー
住所
文京区
出身
未設定
ブログ村参加

2007/08/27

arrow_drop_down
  • 資本・資源の観点からシンギュラリティ不可能論

    人工知能が人間の知性を上回り、その延長に、人工知能が自力で知能の強化をする事、その更なる延長として、知能の向上が加速し、有限時間内に無限大の知能が実現されるような話もあると思います。しかし、それが必要とする前提を色々考えると、どうもそれ(知能増幅)は

  • クロスドメイン拡散を使用した単一画像から3Dへの変換 Wonder3D

    Wonder3D: Single Image to 3D using Cross-Domain Diffusionpaper page: https://t.co/gLYmjli2Biintroduce Wonder3D, a novel method for efficiently generating high-fidelity textured meshes from single-view images.Recent methods based on Score Distillation Samp

  • 歌詞と音響と音楽の好みと道徳的価値観との関連

    「音楽の趣味はその人の道徳や価値観も表す」ことを示唆する論文。クイーン・メアリー大学らによって行われた1,400人以上を対象にした研究によれば、音楽の好みが個人の道徳的価値観を反映し、単なる楽しみだけでなく、私たちの道徳的な感覚や判断を形作る影響力を持っている

  • 電車内でのスマートデバイス利用行動統計 2023/12

    観測期間は2023年7月8日~2023年12月24日で、 記録した人数は延べ 7044人です。前回の記録 電車内でのスマートデバイス利用率 2023/7全体の推移はこうなっています。 これらは実際に視認した数なので、つまり、見えない分を含めた真の利用率はこの数字より必

  • 独自データで音楽生成polyffusionの学習方法

    https://github.com/aik2mlj/polyffusion レポジトリの更新等と合わせて独自データでPolyffusionの学習が分かったのでその方法です。まずmidiデータをnpzファイルにします。python polyffusion/data/midi_to_data.py midifiles/000.mid midifiles/000.npz但し

  • 大規模言語モデルは感情的刺激を理解し、それによって強化できる

    GPT-4 に『チップ払うからいい回答出してや!』というと明らかに性能が上がるらしいの草(実際には払う必要はないので、ChatGPT を騙すだけ騙すと良さそう) https://t.co/mkuebw3iH2— Torishima / INTP (@izutorishima) December 2, 2023 Reminds me of this paper about

  • 高度な機能を備えたマルチモーダルモデル Gemini

    Geminiは最初からマルチモーダルで学習を行なうことで性能改善。代表的ベンチマークMMLUで90%に(但し確信度が一定以上なら多数決、そうでないなら貪欲法で解を出す新推論の効果も大きい)。多くのタスクで最高精度を達成。複数DCで学習し、障害時にインメモリから復帰するh

  • Transformer モデルを使用したビデオからの音楽生成 Video2Music

    動画をもとに音楽を生成するフレームワーク『Video2Music』が登場しました。膨大な学習データをもとに、作品の特徴に合うオーディオを作り出すツールです。マルチモーダルのトランスフォーマーアーキテクチャが採用されています。@ Jaeyong Kang et al., "Video2Music: Suita

arrow_drop_down

ブログリーダー」を活用して、TAKさんをフォローしませんか?

ハンドル名
TAKさん
ブログタイトル
研究開発
フォロー
研究開発

にほんブログ村 カテゴリー一覧

商用