昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
眠すぎる!!!!先週の月曜日も眠かった。今日はオフィスに行ったのでまだ救われていた。 daiiz.hatenablog.com 雨上がりのアイスコーヒー。ローソンの紙コップが夏仕様になって朝顔が咲いていた。 今月も毎日何かしら書けてよかった。いま振り返ったら一記事多かった。WWDCの日に二つ書いていたようだ。うるう記事。 2025-06-10から1日間の記事一覧 - #daiizメモ この記事みたいなしょうもない内容であっても、続けることが大事。一日さぼるだけでもエンジンがかかりにくくなってしまう。いざガッツリ書きたい日に何もできなくなってしまう。書ける日を万全の態勢で迎えるためのメンテナンス…
Phonno Legacyの「この日、この場所」機能がパワーアップした。写真がメタデータとして持っている撮影日時と地理情報の組を利用すると、一連の写真記録を自動で複数の塊に分けることができる。時間的な連続性と地理的な離散性をうまく組み合わせた結果、いい感じに動いている。 GUIでの表現としては、ナビゲーションボタンを配置して、パラパラ漫画のような見せ方が実現できたりする。これもこれで思い出の振り返りUIとして大変便利だが、システム的にはデータ全体を部分的なチャンクに分けて理解できることの価値が大きい。 熱海旅行: 京都駅から熱海の旅館までの記録 Long contextを活かしたLife co…
今日は昼に起きてから、あのお店で中華を食べることだけを目標にして生きていた。Uber Eatsで何度か注文して好きになった四川料理のお店。なんか何を頼んでも美味しい。Uber Eatsでリピートした店は、なるべく店舗での食事も体験したい派。その店があるその町の雰囲気ごと楽しみたい。事前体験で一番のお気に入りメニューはこれ。 辣子鸿丁/ 鶏肉唐揚げのピリ辛炒め Spicy 夕方遅くに涼しくなって来た頃合いを狙って、30分ほど歩いて行ってきた。バスを使ってもいいけれど、久しぶりの新開拓エリアなので歩きたかった。大通りをひたすら歩く。途中まではよく見知った景色だけど、普段使っている道と少しずれること…
図: 時系列画像リストの操作 図: 平均よりちょっと上の成果を繰り返し得ることで、ときどきよい発見をする
昨日インストールしたGemini CLIを使ってみている。 daiiz.hatenablog.com コーディングエージェントの本質とは全く関係ない話だが、文字のグラデーションが格好いい。自作のAIエージェントOkonomiでもやりたい。 Gemini CLIはオープンソースなのでGitHubでコードを読める。特徴的な文字列「Agent powering down.」で検索して実装箇所を探してみる。やっぱりInkを使っているようだ。文字のグラデーションにはink-gradientを使っていた。 import Gradient from 'ink-gradient'; <Gradient col…
Gemini CLIをインストールした。 Google announces Gemini CLI: your open-source AI agent GitHub - google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal. Gemini 2.5 Proを使えるのは強そうだ。
去年買ったSurface Laptopについにリコール機能がやってきた!完全なプライベートでの開発端末なので迷うことなく有効化した。 しばらくこのまま放置して、歴史が溜まったころに使い勝手をレビューします。バックグラウンドで定期的にスナップショットが撮られる体験、何も悪いことをしていないのになんか緊張する。Macのタイムマシン機能よりも緊張するのは、ファイルデータではなくて画面全体のスクリーンショットの連続保存だからだと思う。「何を持っているか」ではなくて「何をしたか」が赤裸々に蓄積される新感覚。楽しみです。 アイスコーヒー 眠くなったら駆け込む場所。今日の店内は冷房が強くて少し寒かった。
先週の月曜日と同じく、朝起きた途端からすでに限界。今週もなんとか乗り切りたい。 daiiz.hatenablog.com
日-曜-日。昼過ぎに起きた。生活リズムが崩壊している。 フィレオフィッシュ - daiiz² フィレオフィッシュの構造式 - ChatGPT¹, daiiz² フィレオフィッシュの構造式(3D)- ChatGPT¹ ¹ OpenAI, ² TeamJ
嬉しかったこと。夜に食べた塩トロ鯖開き弁当の鯖が大きかった。こんなに満足感のあるお弁当を見たのは久々だった。あらゆるものが小さくなっている現代でこれに出会えて感動した。京都ポルタのヒモノ照ラスさんにて。 Touch ID搭載のMagic Keyboardを買った。高級品だけど、なんだかんだ純正が一番しっくりくるので逃げずに買う。Mac mini導入計画の第一歩。生まれてこの方、デスクトップマシン環境で本格的なソフトウェア開発をやったことがない*1ので、購入前にまずは慣れられるかを検証していきたい。憧れの環境。いま使っているMacBook Airをクラムシェルモードにして疑似的に体験してみる。 …
同僚とコメダ珈琲。今週もお疲れ様でした。 クロネージュ
ソフトバンク回線利用特典の1年間の無料期間が終了したのでProプランから引退した。Perplexityは検索体験を徹底的に研究しているAIプロダクトとして、登場当初はかなり期待していた。Google検索の代わりに積極的に使ってみたり、ブックマークや記事の共有機能も試していた。 Proマークが消えた様子 しかし、ChatGPTやGeminiなどの大手汎用AIがウェブ検索機能を充実させてきたり、GoogleにSGE (AI Overview) が搭載されたここ最近は、残念ながらほとんど起動しなくなってしまった。いま振り返ると、ChatGPTとほぼ同時期にリリースされたDeep Researchの精…
暑すぎる 空を使った扇風機 - ChatGPT¹, daiiz² ¹ OpenAI, ² TeamJ
ここ2, 3ヶ月くらい、生活に必要な体力のすべてを非常用バッテリーで賄っている感じがする。非常用の低エネルギーでもこここまで動けていて、それなりの生産性を維持できているのはすごいことだ。あとどれくらい持つのだろうか。 ✅️ ヤマト運輸の営業所に技術書典あての本を持ち込んだ ✅️ コードを書いた ✅️ コードをレビューした ✅️ 新しく見つけたお店でカレーを食べた イエローカレー
週の初めはパフォーマンスがよくない。 ✅️ 起きる ✅️ 発送指示書を印刷する ✅️ 発払い伝票を書く ✅️ コードを書く
この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛くなかった、残念。チキンサラダが美味しかった。食後に眠気が襲ってこなかったのでサラダ生活を始めようか。 技術書典18、無…
ChatGPT o3(ウェブアプリ)で写真から文字の領域を切り出して文字画像を作る実験。さて、オリジナルの写真は何でしょうか!? 日常風景から文字を集めるアプリを作りたい。
今週もお疲れ様でした!! 缶ビールをカシュッと開けたらClaudeのロゴのアメーバみたいな飛沫(しぶき)ができた記念。 Claude Max プランを契約しようかと迷っている今日このごろ 芸が細かい。
Phonno: 写真に対するCrop with AI機能の改善
PhonnoのCrop with AI機能の精度を改善した。この機能では、ボタンを押すだけで画像から得られる知識として重要な箇所を特定できる。実装としては、以下の記事のように、従来のCloud Vision APIをやめてGeminiを使うよう舵を切っていた。 daiiz.hatenablog.com 今回はGeminiに渡す際のプロンプトの調整を行った。その結果、特に写真に対する切り抜き領域の特定が安定した。熱海旅行での写真を例にいくつか紹介してみる。 ボトルを中心にして程よいサイズの矩形を作れている。文字の読み取り精度と画像の説明も悪くない。 注目したいオブジェの位置を正確に捉えている。文…
知的生産活動支援 AI Agent「Okonomi」の開発を続けている。 daiiz.hatenablog.com PNG画像に対応したことで、PCやスマホのスクリーンショットをネイティブに理解できるようになった。フォルダに突っ込んでおくだけでよしなに情報抽出できる。これの動作の様子は別の機会にまとめる。 JPEG画像に対応したことで、実世界の写真を読み解けるようになった。インデクシング工程でGeminiで画像を解析し、得られた視覚的な情報をOkonomiの独自のテキストフォーマットで文字として記録しておく。推論時にはこのテキストメモと画像バイナリを両方入力として使う。Geminiはマルチモー…
京都に帰ってきた。明日からは開発に戻っていく。ここから先の仕事との向き合い方を改めて考えていきたい。この大AI時代に、キャリア8年目として、何をするべきなのか。 ホテル 今回の熱海旅行で泊まっていたホテル。波の音が心地よくてとても良いところでした。二泊くらいあるとバーとか温泉とかを余裕を持って堪能できると思う。Instagramをフォローしてステッカーをもらった。 ロビーとステッカー 帰りの送迎バス 記念のボールペンを買った。ほどよい重みがあっていい感じ。 JR熱海駅 散策 www.atami-yogurt.com 熱海ヨーグルト発酵所の「のめるヨーグルト」。たまたまお洒落な店を見つけて買って…
熱海のホテルでWWDC25の鑑賞会をしている。 kanataくんのプロジェクタで壁に投影している 名前がわかりやすくなった macOS Tahoe 期待。Spotlightからクリップボードの履歴にアクセスできるようになるだけですでに嬉しい。 お疲れ様でした 直後の感想 新デザイン「Liquid Glass」も全体的にはよさそう。ただ、Windows VistaのAeroみは感じる。
熱海に来ている。 JR熱海駅 小雨が降っていて思ったより寒かった。運のいいひかり号に乗れたらしく、京都から熱海まで乗り換え無しで来れた。 熱海駅開業100周年とのこと。おめでとうございます。 昼に食べた鯖の味噌煮定食 終盤に小骨に舌を攻撃されたけど、口内細胞の修復スピードだけは信頼しているので問題ない。 手作り海鮮丼。 あら汁に白身魚の刺身を入れたら美味しかった。エビストローネ(海老の刺身+ミネストローネ)もいい感じだった。 懐かしい バブル時代の面影を感じる バブル期の建造物が大好きです。 daiiz.hatenablog.com
Okonomi - 知的生産活動支援 AI Agent の試作
知的生産活動を支援するAIエージェント「Okonomi」を作っている。 広島でお好み焼きのワークフローを眺めていたときに思いついた、Claude Code + NotebookLM + 曖昧記憶グラフ を組み合わせたツールの骨格ができてきた— daiiz@技術書典18 せ02 (@daizplus) 2025年5月30日 この土日での進捗を紹介します。複数のPDFファイルを読み込んで論理的な目次を生成し、質問応答ができるようになった。さらに実験的な機能として、対話のAutopilotモードも実装した。言語モデルはGemini 2.5 Flashを使っている。難しいタスクは部分的にProやCla…
個人開発でGemini縛りでAI Agentを作っている。API利用料金が高くなってきた。Thinking Text Outputが半分以上を占めている模様。 共著者の多いプルリクエスト
本日のClaude Codeとの会話の一コマ
がっつり中華料理を食べて爆睡した。 眠気が襲ってこない食事を心がけたい。食後の時間も有効活用したい。 ゆっくり食べればいいのかな。 技術書典18で開催中のオンラインマーケットで新刊・既刊ともにぽつぽつと売れ続けている📚 ありがとうございます! 購入時にXに投稿していただけたら、いいねとリポストしにいきます。 京都も夏を感じるようになってきた。 夏バテ対策も頑張りましょう!!
プロンプトの改良を続け、モデルの進化の恩恵を受けた結果、Phonnoで生成されるフローチャートが安定してきた。リリース当初と比べて生成結果の文法エラーが減少し、さらに本質的な情報を捉える能力や表現力も向上している。画像知識からフローチャートを生成できるこの機能、Phonnoのキラーフィーチャーとして育てていけるかもしれない。 技術書典18に関する情報を構造化した様子 チャートのノードをクリックして検索できるようにしたら、これまた楽しい。ユーザーに検索クエリツリー(グラフ)を見せてあげている感じになる。リスト形式での単語のサジェストはよくあるけれど、この方式ではエッジで繋ぐことで単語の意味的な関…
頭のなかで、開発作業を怠けていないかを見張られている。なんで手を動かしてないの〜って言われる。惰性であっても手を動かしていればなにか形になってきて、形が見えてくると今度は改良したくなる。こうやって生まれてくるなにかもある。
ネムスギル! 技術書典で買った本をぼんやりと読むことしかできなかった。事務作業は進んだ。月曜日は縦になっただけでも偉いということで、どうか許してください! これは昨晩に食べたフォーです。
技術書典のオフライン参加を終えて、京都に帰ってきた。 新幹線ホームの自販機で作れるコーヒー。微糖にしてみた。 夜の京都駅は空いていた。急いで走っている人とゆったりしている人が半々くらい。 原稿の締切から無事に開放されたので、ここらしばらくは開発に力を入れていきます。
「ブログリーダー」を活用して、daiizさんをフォローしませんか?
昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
写真をWhiskで画風変換して、Veo 2で動画生成した。 すき家で食べたエビのビスクソースカレー 喫茶宇宙 フルーツサンドパーティー Whisk APIほしいな〜
眠すぎる!!!!先週の月曜日も眠かった。今日はオフィスに行ったのでまだ救われていた。 daiiz.hatenablog.com 雨上がりのアイスコーヒー。ローソンの紙コップが夏仕様になって朝顔が咲いていた。 今月も毎日何かしら書けてよかった。いま振り返ったら一記事多かった。WWDCの日に二つ書いていたようだ。うるう記事。 2025-06-10から1日間の記事一覧 - #daiizメモ この記事みたいなしょうもない内容であっても、続けることが大事。一日さぼるだけでもエンジンがかかりにくくなってしまう。いざガッツリ書きたい日に何もできなくなってしまう。書ける日を万全の態勢で迎えるためのメンテナンス…
Phonno Legacyの「この日、この場所」機能がパワーアップした。写真がメタデータとして持っている撮影日時と地理情報の組を利用すると、一連の写真記録を自動で複数の塊に分けることができる。時間的な連続性と地理的な離散性をうまく組み合わせた結果、いい感じに動いている。 GUIでの表現としては、ナビゲーションボタンを配置して、パラパラ漫画のような見せ方が実現できたりする。これもこれで思い出の振り返りUIとして大変便利だが、システム的にはデータ全体を部分的なチャンクに分けて理解できることの価値が大きい。 熱海旅行: 京都駅から熱海の旅館までの記録 Long contextを活かしたLife co…
今日は昼に起きてから、あのお店で中華を食べることだけを目標にして生きていた。Uber Eatsで何度か注文して好きになった四川料理のお店。なんか何を頼んでも美味しい。Uber Eatsでリピートした店は、なるべく店舗での食事も体験したい派。その店があるその町の雰囲気ごと楽しみたい。事前体験で一番のお気に入りメニューはこれ。 辣子鸿丁/ 鶏肉唐揚げのピリ辛炒め Spicy 夕方遅くに涼しくなって来た頃合いを狙って、30分ほど歩いて行ってきた。バスを使ってもいいけれど、久しぶりの新開拓エリアなので歩きたかった。大通りをひたすら歩く。途中まではよく見知った景色だけど、普段使っている道と少しずれること…
図: 時系列画像リストの操作 図: 平均よりちょっと上の成果を繰り返し得ることで、ときどきよい発見をする
昨日インストールしたGemini CLIを使ってみている。 daiiz.hatenablog.com コーディングエージェントの本質とは全く関係ない話だが、文字のグラデーションが格好いい。自作のAIエージェントOkonomiでもやりたい。 Gemini CLIはオープンソースなのでGitHubでコードを読める。特徴的な文字列「Agent powering down.」で検索して実装箇所を探してみる。やっぱりInkを使っているようだ。文字のグラデーションにはink-gradientを使っていた。 import Gradient from 'ink-gradient'; <Gradient col…
Gemini CLIをインストールした。 Google announces Gemini CLI: your open-source AI agent GitHub - google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal. Gemini 2.5 Proを使えるのは強そうだ。
去年買ったSurface Laptopについにリコール機能がやってきた!完全なプライベートでの開発端末なので迷うことなく有効化した。 しばらくこのまま放置して、歴史が溜まったころに使い勝手をレビューします。バックグラウンドで定期的にスナップショットが撮られる体験、何も悪いことをしていないのになんか緊張する。Macのタイムマシン機能よりも緊張するのは、ファイルデータではなくて画面全体のスクリーンショットの連続保存だからだと思う。「何を持っているか」ではなくて「何をしたか」が赤裸々に蓄積される新感覚。楽しみです。 アイスコーヒー 眠くなったら駆け込む場所。今日の店内は冷房が強くて少し寒かった。
先週の月曜日と同じく、朝起きた途端からすでに限界。今週もなんとか乗り切りたい。 daiiz.hatenablog.com
日-曜-日。昼過ぎに起きた。生活リズムが崩壊している。 フィレオフィッシュ - daiiz² フィレオフィッシュの構造式 - ChatGPT¹, daiiz² フィレオフィッシュの構造式(3D)- ChatGPT¹ ¹ OpenAI, ² TeamJ
嬉しかったこと。夜に食べた塩トロ鯖開き弁当の鯖が大きかった。こんなに満足感のあるお弁当を見たのは久々だった。あらゆるものが小さくなっている現代でこれに出会えて感動した。京都ポルタのヒモノ照ラスさんにて。 Touch ID搭載のMagic Keyboardを買った。高級品だけど、なんだかんだ純正が一番しっくりくるので逃げずに買う。Mac mini導入計画の第一歩。生まれてこの方、デスクトップマシン環境で本格的なソフトウェア開発をやったことがない*1ので、購入前にまずは慣れられるかを検証していきたい。憧れの環境。いま使っているMacBook Airをクラムシェルモードにして疑似的に体験してみる。 …
同僚とコメダ珈琲。今週もお疲れ様でした。 クロネージュ
ソフトバンク回線利用特典の1年間の無料期間が終了したのでProプランから引退した。Perplexityは検索体験を徹底的に研究しているAIプロダクトとして、登場当初はかなり期待していた。Google検索の代わりに積極的に使ってみたり、ブックマークや記事の共有機能も試していた。 Proマークが消えた様子 しかし、ChatGPTやGeminiなどの大手汎用AIがウェブ検索機能を充実させてきたり、GoogleにSGE (AI Overview) が搭載されたここ最近は、残念ながらほとんど起動しなくなってしまった。いま振り返ると、ChatGPTとほぼ同時期にリリースされたDeep Researchの精…
暑すぎる 空を使った扇風機 - ChatGPT¹, daiiz² ¹ OpenAI, ² TeamJ
ここ2, 3ヶ月くらい、生活に必要な体力のすべてを非常用バッテリーで賄っている感じがする。非常用の低エネルギーでもこここまで動けていて、それなりの生産性を維持できているのはすごいことだ。あとどれくらい持つのだろうか。 ✅️ ヤマト運輸の営業所に技術書典あての本を持ち込んだ ✅️ コードを書いた ✅️ コードをレビューした ✅️ 新しく見つけたお店でカレーを食べた イエローカレー
週の初めはパフォーマンスがよくない。 ✅️ 起きる ✅️ 発送指示書を印刷する ✅️ 発払い伝票を書く ✅️ コードを書く
この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛くなかった、残念。チキンサラダが美味しかった。食後に眠気が襲ってこなかったのでサラダ生活を始めようか。 技術書典18、無…
ChatGPT o3(ウェブアプリ)で写真から文字の領域を切り出して文字画像を作る実験。さて、オリジナルの写真は何でしょうか!? 日常風景から文字を集めるアプリを作りたい。
今週もお疲れ様でした!! 缶ビールをカシュッと開けたらClaudeのロゴのアメーバみたいな飛沫(しぶき)ができた記念。 Claude Max プランを契約しようかと迷っている今日このごろ 芸が細かい。
こういう時代なので作りたいものや試したいアイデアは山ほどあるのだけど、いまいちモチベーションが高まらない。自分に何を求められているのかも見失いつつある。もっと盛り上げていきたいけれど、実は方向性を間違えているのかもしれない。いまはひたすらに頑張って向き合って、刺激を取り戻したい。