Gemini CLI 使ってみた! Gemini の CLI が公開されたので試してみました
プログラミング関連のメモ帳的ブログです。 調べたものは後でまとめようとメモしているのですが、メモ止まりで全然やらないので調べたときに書こうと思います。
IP-Adapter の InstantStyle を試してみる (5) - まとめ
過去数回に渡り IP-Adapter の InstantStyle を試してきました。 InstantStyle では スタイル層 にのみ IP-Adapter を適用したり、 レイアウト層 にのみ IP-Adapter を適用したりできました。 今回の記事はそのパターンのまとめ記事になります。
IP-Adapter の InstantStyle を試してみる (4) - IP-Adapter のスケール未設定の場合
前回の記事 今回は、IP-Adapter のスケールは未設定で行きます。つまり InstantStyle ではなく、通常の IP-Adapter ということになります。
IP-Adapter の InstantStyle を試してみる (3) - レイアウトレイヤーだけ IP-Adapter を適用してみる
前回は スタイルレイヤー と思われる up プロパティを残して出力してみました。 今回は レイアウトレイヤー と思われる down プロパティを残して出力してみたいと思います。 前回の記事
IP-Adapter の InstantStyle を試してみる (2) - スタイルレイヤーだけ IP-Adapter を適用してみる
前回の記事 さて、前回は、レイアウトレイヤーとスタイルレイヤーがあり、 以下の理解に至りました。 つまり? down-part の block_2 がレイアウト情報の層 up-part の block_0 がスタイル情報の層 ということでしょうか? 今回はそのうち up-part だけ残して スタイルの層 だけに IP-Adapter を適用してみます。
IP-Adapter の InstantStyle を試してみる
本日は Style & layout control を試してみます。 こちら diffusers v0.27.2 では実装されておらず、先日の IP-Adapter FaceID と同様エラーになります。diffusers は main ブランチを使用します。 diffusers の main ブランチの話はこちらの記事 今度はエラーになっても、慌てず騒がずだった!
IP-Adapter Face Model + LCM LoRA で高速生成
huggingface.co 本日はドキュメントの Instant Generation の項目を進めていきます。 端的に言うと IP-Adapter + LCM LoRA です。 なんとこれはdiffusers v0.24.0のリリースノートにもあったので以前にやっていました よって本日は IP-Adapter Face Model + LCM LoRA で進めていこうと思います。Face Model は ip-adapter-full-face_sd15 を使いますので、この前やった薔薇を持っている女性を生成してみます。 この前やった記事
IP-Adapter FaceID が無事実行できたので Multi IP-Adapter を試してみる
無事に IP-Adapter FaceID が実行できたところで、 今回は Multi IP-Adapter を試してみます。 huggingface.co
id:touch-sp さん、ご助言ありがとうございました! どうしてエラーが発生するのか理解に繋がりました 🙇 早速、 IP-Adapter FaceID に再チャレンジしてみようと思います。
コミュニティパイプラインで IP-Adapter FaceID モデルを実行してみるができなかった件
前回の記事で IP-Adapter FaceID でエラーになり、色々調べているうちに同じような問題にハマっている人を見つけました。 github.com なんかヒントになりそうなことが書かれているので深堀りしていきます
IP-Adapter FaceID がエラーになってドキュメント通りに実行できなかった件
前回までの記事では h94/IP-Adapter というリポジトリの 顔モデル (ip-adapter-full-face_sd15) を使用していました。 前回までの記事はこの辺です 本日は Hugging Face のドキュメント を少し進め、 h94/IP-Adapter-FaceID というリポジトリの ip-adapter-faceid_sd15 を使おうとしましたがエラーになってしまいました。 よって、本日の記事では、トラブルシューティング的な感じで進めていきます。
IP-Adapter の GitHub リポジトリから ip_adapter-full-face_demo の生成を試してみる (3)
もう少し ip-adapter-full-face_sd15 で遊んでみます
IP-Adapter の GitHub リポジトリから ip_adapter-full-face_demo の生成を試してみる (2)
早速前回の続きをやっていきます。 今回は、IP-Adapter に利用する画像は同じものを使用し、 プロンプトの変更 や モデルの変更 のみで、顔の雰囲気を維持したまま異なる絵を生成します。
IP-Adapter の GitHub リポジトリから ip_adapter-full-face_demo の生成を試してみる
zako-lab929.hatenablog.com さて、前回は diffusers のドキュメント から IP-Adapter の Face Model というものを使ってみました。具体的には ip-adapter-full-face_sd15 を使わせていただきました。 今回は GitHub リポジトリ から ip_adapter-full-face_demo を読み解きながら diffusers に置き換えてみようと思います。「読み解きながら」というのは恐らく GitHub リポジトリのソースコードは diffusers に実装される前のデモになっているため load_ip_adapt…
IP-Adapter の Face Model を試してみる
huggingface.co IP-Adapter には顔を生成するように特別にトレーニングされたモデルがあるようです。 この記事では Hugging Face のドキュメント を参考に ip-adapter-full-face_sd15 を使ってみます。
IP-Adapter の基本形(General Tasks)を SD1.5 版でやってみる
前回、チャレンジして Text-to-Image , Image-to-Image , Inpaint 全てにおいてメモリ不足によるクラッシュが発生しました。 原因としては、サンプルコードが SDXL 系の IP-Adapter となっており、パイプラインを実行する以前に IP-Adapter のロードを突破することができませんでした。 そこで、SDXL 系ではなく SD1.5 系に置き換えて実行してみようと思います。
IP-Adapter の基本形(General Tasks)を使ってみる
この記事では、ドキュメントに含まれる General Tasks を進めていこうと思いましたが、ほとんどのサンプルコードが SDXL 向けの IP-Adapter となっていて、 IP-Adapter をロードを実行中にセッションがクラッシュしてしまうことがわかりました。 メモリ不足。。。 悲しみです。 IP-Adapter で SDXL 系を動かすことは今の状態では叶わなぬ願いかもしれないです。 唯一 AnimateDiff x IP-Adapter のサンプルコードだけ SD1.5 系統だったため、クラッシュせずに実行ができましたので、この記事ではその1つだけを進めていきます。
ピッコロ記念日なのでピッコロ大魔王を生成したかったけど LoRA が見つからなかったので結局 IP-Adapter の記事になった件
とりあえず、昨日の記事同様、タイトルはすごい長いラノベ風にできたのは良いとして、、、 前回の IP-Adapter の記事に引き続き diffusers v0.24.0 のリリースノート に沿って IP-Adapter を使ってみる回になります。 前回は、 IP-Adapter を差し込んで LCM LoRA を併用していました。 今回は、 ControlNet を併用する形になります。
IP-Adapter を触るつもりだったけど日付を見たら5月8日だったので悟飯を生成していた件
IP-Adapter の続きやろーって思ったのですが、日付を見て気づいてしまいました。 あ、、、明日はピッコロ記念日だ。。。 つまり、今日は悟飯の日でしたので、急いで Civitai で検索しました! こちらを採用。やっぱ超サイヤ人2っていいよね!
IP-Adapter を使ってみる - LCM LoRA を併用
github.com ゴールデンウィークはほとんどPCを触らず、デジタルデトックス状態でした。 そんな中、ようやく到着しました。IP-Adapter !! どうやら IP-Adapter と一口に言ってもなんか色々な種類がありそうな予感。 何にせよ、触っていかないと進まないですからね。 色々調べるのは後にして、とりあえず触ってみます。
この記事では diffusers v0.24.0 のリリースノート から SDXL-Turbo を使ってみます。 1ステップで出力できるくらいターボ!
動画生成の振り返りとStable Video Diffusion
github.com ついに Stable Video Diffusion まで到達しました。 diffusers v0.24.0 は Stable Video Diffusion もあるし IP-Adapter もあるし、凄い楽しそうです まずは Stable Video Diffusion から触っていきますが、過去にやった動画生成も振り返ってみます。
「ブログリーダー」を活用して、ちびジャコさんをフォローしませんか?
Gemini CLI 使ってみた! Gemini の CLI が公開されたので試してみました
WSL を導入した 今までは VirtualBox を使っていましたが、 最近、メインの PC が変わったので WSL を導入しました。 今のところ VirtualBox より軽い感があって良きです。 とりあえず、今わかっている使い勝手をメモしておきます
VS Code から MCP サーバーを利用してみる VSCode に MCP サーバー対応が入ったので使ってみました
前回の関連記事 昨日、マルチプレイ設定が知らぬ間に反映し、できるようになっていました。 全然できなかったのに急にです。 時間が解決してくれた可能性がありますが、 昨日、寝る前に 再びマルチプレイはブロック状態 にしておきました。 そして今日...
マルチプレイが無効になっています こんばんは! 再び1ヶ月ぶりです! お仕事の方は相変わらず忙しいです! それは置いといて、私は、CoderDojo という 子どものための非営利プログラミング道場 でメンターをしているのですが、 Dojo に来ているマイクラ勢の子たちに触発されて、我が家の子どももマイクラやりたい!!になりました。 自分用のアカウントは1個ありますが、もう1個買う必要があるな・・・と。 そして、買ったはいいものの、マルチプレイで問題が・・・
こんばんは! 1ヶ月ぶりです! お仕事の方が非常に忙しくなり、記事を書いている時間がなくなりました! なるべく書きたいとは思っているので、週1でも月1でも頑張りたいと思います! そんな中、たくさんインプットはしているので、インプットした情報をメモしておくために Obsidian っていうメモアプリを導入してみました。 Evernote とか Joplin とか色々なメモアプリを試していますが、ナレッジグラフに惹かれて Obsidian にしてみようと思いました!
WSL を導入した 今までは VirtualBox を使っていましたが、 最近、メインの PC が変わったので WSL を導入しました。 今のところ VirtualBox より軽い感があって良きです。 とりあえず、今わかっている使い勝手をメモしておきます
前回の関連記事 Web コンソール便利すぎでしょ
前回の関連記事 ハッカソンではメンターもやってたので、AppSync について聞かれました。使ったことないサービスだったので調べました。
AWS のリソースを構築する際にいつも手でポチポチやっていますが、 ふと Cognito くらいならユーザープール作るくらいだし。って思って、terraform をちょっと調べて使ってみました。 せっかくなので、調べたことをまとめました。
こんばんは 昨日、一昨日と社内のハッカソンに参加していました。 無事にプレゼンもいっぱい笑っていただき一安心です。 さて、一時期ドローンの記事を書いていましたが、 つい1週間前まで使うか使わないかも決まってない状態でしたが、 無事にハッカソンで活用することができました。 また、今回は使わなかったですが VMC Protocol に近いところで、姿勢推定を使いました。 もともとモーションキャプチャーや姿勢推定などその辺を使いたいなーって思っていたので、 コンセプトは変わらず、希望通りの技術を使うことができました。 過去記事まとめです
前回の関連記事 カスタムノードを実装してみます!
前回の関連記事 前回、上記で API を作って Frontend から叩いたところエラーになり、https 化して解決しました。今回は http(s) の話は置いといて、API サンプルの作り方をメモしておく記事です。
前回の関連記事 UART を利用するデバイスの事前準備として、「汎用シリアルポート設定をしてください」 となっていました。 このあたり、全然詳しくないのですが・・・ UART とは何なのか?UART と汎用シリアルポートの関係は?
Raspberry Pi Zero 2 で Node-RED を使って立てた API を Frontend から叩いてみたらエラーが出ました。 Mixed Content: The page at 'https://**********/' was loaded over HTTPS, but requested an insecure resource 'http://192.168.1.13:1880/hello'. This request has been blocked; the content must be served over HTTPS. さてさて原因は?
前回の関連記事 3.3V ピンは、常に 3.3V の電圧が掛かっているようですが、 GPIO ピンはプログラムから電圧を掛けるか掛けないかを制御できるようです。 本日は GPIO を使って、Python から LED を制御します
Lチカ回路 (ボタン付き) 前回の関連記事 本日はボタンをポチポチできるようにしてみましたよ ボタンによって LED を付けたり消したりする ブレッドボード: x1 LED: x1 抵抗 (1kΩ): x1 ジャンパーワイヤー(オス - メス): x2 ボタン: x1 Lチカ回路 (ボタン付き) ボタンを押していない状態だと、電流は LED の方には流れていませんが、 ボタンを押すことで、ボタンの左側の足に電流が流れるようになります。 その先は、昨日の Lチカ回路と同じです。 何も考えずに電源を入れる まずは何も起きません! ボタンをポチッとすると LED が光ります! まとめ 初めてボタンを…
前回の関連記事 本日は、とりあえずLチカしてみましたよ
zako-lab929.hatenablog.com 前回、OS を書き込んで起動するところまで確認しましたが、起動した後に何も操作できずに詰んでました。 本日は、USB micro B の USB ハブが届きましたので、作業を少し進めておきます Raspberry Pi OS の初期設定について Raspberry Pi OS の初期設定 ホスト名の設定 だったり ユーザーの設定 , Wi-Fi の設定などができるようです。サービスからは SSH の設定ができます。 Wi-Fi の設定は GUI から行おうと思ったので OFF にしておきました。 設定値 設定値 チェックボックス メモ ホス…
2025年1月8日にリリースされた Stability AI の image-to-3D model です。 記事によると Stability AI Community License に基づき商用および非商用の両方で無料で使用できます。とのことです。
github.com geolib っていうモジュールもスターが多くて良さそうだぞ? ということで、本日は Turf.js とは異なる緯度経度計算モジュールを使ってみようと思います。 モジュール選定大事 geolib というモジュールでやってみる モジュールのインストール $ yarn add geolib 使い方 import * as geolib from "geolib"; const from = { lat: "35.65862055760233", lng: "139.74543043734087" }; const to = { lat: "35.71013065861893"…
zako-lab929.hatenablog.com 昨日、 Google Map 上で距離が測れることを知りましたが、 本日は React 上で 緯度経度 を指示して距離を計算してみたいと思います。
札幌~那覇空港まで 2,248.57 km これは、知らなかった機能でした。 思わず、おぉ!となった Tips です
firebase.google.com 本日は Firestore でリアルタイム性を発揮してみます。 使ったことない Firestore でしたが、 新しい知見が増えるということはやっぱり楽しいですね! Realtime Database と Firestore どっちを採用するかは悩ましいところですが、 データ量や課金対象のアクションを理解した上で検討するのが良さそうだと思いました。
zako-lab929.hatenablog.com さて、Firestore は使ったことないのですが、 メモがてら使ってみようという魂胆で進めていきます。 今回も前提として各種準備が終わっている状態からのスタートになります。
zako-lab929.hatenablog.com さて、 Realtime Database はざっくりまとめたし、次回から導入スピードは上がると思います。 Firestore は使ったことないのですが、いまいち Realtime Database との違いがわからないんですよね。両方ともオフラインサポートしているし、リアルタイムな処理もできるって言いますしね。。。 わからないなら使ってみようと思います。 このブログを機に触ってみようと思います。
zako-lab929.hatenablog.com Firebase コンソール から Realtime Database の初期セットアップが作成が終わったら、Firebase SDK 経由で Vue プロジェクトから使えるようになっています。 この記事では、チャットのように文字列を送信及び受信するサンプルをまとめておきます。
zako-lab929.hatenablog.com 昨日、Firebase プロジェクトを作成しました。 本日は、Realtime Database の初期セットアップのやり方をまとめておきます。
zako-lab929.hatenablog.com 前回の記事でも使っている Firebase ですが、 Firebase コンソール 上でプロジェクトを作って API-Key などを発行する必要があります。 本日は、初回セットアップのやり方をまとめておきます。
みんなでスタンプ機能 ここ最近、Vue の記事を書いていましたが、作りたかったのはコレです! ドラゴンクエストウォークみたいな揮発性のスタンプ機能を作りたかったです
レポート JDLA Generative AI Test 2024 #1 に合格してました! ひっそりと受験してました!
onChildAdded ニャンコ (SD3 産) 前回の記事 前回、 Firebase の Realtime Database の記事を残しましたが、 記事内で child_added が「起動時に全部飛んできてしまう」ということを嘆きました。 今回は、その対策を行ったのでブログに残します。
Stable Diffusion 3 ニャンコ (SD3 産) 前回の記事で、ふと作ってみました。アイキャッチ画像。 前回の記事 こういう使い方良くない??? まとめ 商用アプリに組み込むわけじゃないから、こういう使い方ってしてもいいのかな? Stable Diffusion 3 Medium の使い方はこちら ランキング参加中【公式】2024年開設ブログ ランキング参加中プログラミング
Firebase ニャンコ (SD3 産) 昨日作成した Vue2 のライブラリプロジェクト で、 Firebase Realtime Database を使おうとしています。 よく使う onValue と onChildAdded の挙動について、よく忘れるので記事にしてみます。 Firestore は使ったことないのよね~
ちょっと間に Stable Diffusion 3 を挟みましたが、 Vite + Vue2 の続きをメモします。 今日は、このプロジェクトでライブラリビルドを行い npm package 化しようと思います。 目標は Vue2 の任意のプロジェクトで使えることです!
前回の記事 前回、公開されたばかりの Stable Diffusion 3 を使いました。 その中で、端折ってしまいましたが、Hugging Face のアカウントが必要だったりアクセストークンを発行したりしなくてはなりません。 この記事では、アクセストークンの発行の仕方をメモしています。
SD3 で生成されたニャンコ 最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表 — Stability AI Japan Stable Diffusiion 3 Medium が公開されましたので早速使ってみました。
Vite + Vanilla 前回の記事では Vite と Vue3 を使って npmパッケージ を使えるところまで作成しましたが、どうやら Vue2 プロジェクトでは使用できないようです。今回は、Vite を使って Vue2 でライブラリビルドをできるように Vite + Vue2 の準備をしようと思います。
前回の記事で Vite を使って Vue3 の npm package を作成しました。 しかし、 TypeScript からだと型定義エラーになってしまうことが判明しました。 この記事では TypeScript のプロジェクトからもエラーなく利用できるように型定義ファイルを出力する方法を調べていこうと思います。
なんで前回、急に Vue を触ったかというと、 npm install 可能な Vue の コンポーネント を作りたかったんですよね。 調べてみると Vite のオプションで ライブラリモード なるものがあるようなので、 こちらを使ってみようと思います。