昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
有給休暇 1日目 Phonnoの開発が捗った。画像の視覚情報からグラフを構築する「Visual Meaning Graph」機能を試作して、ドッグフーディングを開始した。 Visual Meaning Graph #Phonno pic.twitter.com/LQ3p6302Cm— daiiz (@daizplus) 2025年4月30日 検索結果や画像ページで生成される思考チャートをMermaidのコードとしてエクスポートできるようになった。Cosenseにコードブロック記法で貼り付けやすくなった。 Phonno’s thought charts can now be exported a…
GPT-4との別れの日が近づいてきたので手紙を贈った。 Farewell and thank you, GPT-4 🌸 送別会もしたい。 GPT-4の送別会しないと pic.twitter.com/2vIaymslKn— daiiz (@daizplus) 2025年4月17日
街灯に寄生した道路標識を見つけた。ミャクミャク様かもしれない。
櫻坂46 5th TOUR 2025 “Addiction”の名古屋公演に友人と参戦してきた。細かい感想は千秋楽まで控えておくとして、超絶に最高だった!! ポートメッセなごや 終演後のステージ(写真加工済み) 終演後のステージ(写真加工済み) 規制退場の待ち時間にステージを撮らせてもらえる図らい、ありがたい。
こぼれいくら丼 黒ビールレーズントーストレアチーズ 名古屋のイメージとあっているワンカット
東京駅 八重洲中央口 新幹線終電 着席成功 京都に帰ってきた。
昨日に引き続き、本日のAIの無駄遣いを紹介します。ソースコードのタイポ TOOD -> TODO の提案をしてもらいました。ツイートにたくさんいいねが付いていて恥ずかしい。新幹線で揺られて書いたコードなのでこういうこともある!と言い訳しておく。 pic.twitter.com/Kw7C1Sa71D— daiiz (@daizplus) 2025年4月24日 中華食べた。美味しかった。 麻辣先生老四川麻婆豆腐、本場四川よだれ鶏、青山椒よだれ鶏
最近のo3モデルの無駄遣いを紹介します。 正多面体 → 正多明太 → せいためんたいくん です。かわいいね。
眠れない夜の散歩
眠すぎる。眠いけどうまく寝れない。寝るための力すら残っていないというのか!寝たら起きれる保証がないくらいのエネルギー残量だから寝ないようにしているとでも言うのか! ここ最近ずっと眠い眠い言ってる眠い— daiiz (@daizplus) 2025年4月21日
以前に環境を整えたClaude Desktopで試していく。JSON-RPC 2.0やModel Context Protocolの仕様もPhonnoでざっくり読んだので裏側で起きていることも想像できるようになった。いよいよ実物を動かして挙動を観察していくフェーズに突入。 daiiz.hatenablog.com daiiz.hatenablog.com 下記のサーバーをREADMEに従って追加する。コードを読むと import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js"; で実装されている…
松屋の店舗限定メニュー「水煮牛めし」を食べるためだけに山科(やましな)に行ってきた。前回の水煮と同じく、期待通りに美味しかった。牛めしと組み合わせることで松屋の強みをより活かした作品に仕上がっていた。水煮の辛さが若干手加減された感じはするものの、唐辛子と花椒の痺れ具合は健在だったのでよかった。 リピートしたいところだが、乗り換え有りの片道30分で通うのは大変そう。駅前の本屋とスタバの雰囲気も気に入ったことだし、週末だけならいいか? 水煮牛めし並盛 前回の水煮牛肉に挑戦した日記はこちら💁♂️ daiiz.hatenablog.com
Phonno: 画像の視覚的な説明生成機能でもo4-miniを採用
昨日に引き続き、OpenAIの新モデルの採用と調整を進めている。 daiiz.hatenablog.com 画像画面でDescribe with AIボタンから使える機能。画像の説明文がo4-miniで生成されるようになりました。これまでのgpt-4oよりも視覚的に読み取れる情報が丁寧に描写されます。ここで生成(もしくは手書き)した説明文は検索インデックス構築時にも参照されるため、手厚く書くことでより探しやすくなります。 画像の特定の領域に関する説明の生成結果の例 Phonno’s visual explanation generator for images & annotations no…
Phonno: gpt-4.1, o4-miniを部分的に採用
チャット用のモデルの選択肢のひとつであったo3-miniをo4-miniに更新した。 Phonno now supports o4‑mini! 🎉— daiiz (@daizplus) 2025年4月17日 長考型のモデルなので出力に時間がかかってもどかしいが、他のモデルと比べるとそれなりにポイントを抑えた端的な回答が得られる。薄い本『LLM時代の検索を考える観察日記』を収録したボックスにおける、クエリ「SGEの特徴は?」に対する答えの例を以下に示す。 o4-mini での回答(2025/4/18 時点) claude-3.7-sonnet での回答(2025/4/18 時点) また、検索画面…
LAPRASさんのイベント「【集え!関西エンジニア】いま熱いものLT大会」でLTしてきた。会場はグラングリーン大阪 北館、さくらインターネットさんのイベントスペース Blooming Camp。 bloomingcamp.sakura.ad.jp 発表資料はこちら。来場者に楽しんでもらえたようでよかった。これから大阪万博の会期中は毎日ミャクミャク様の変異体を生成していきます。懇親会でもSVGやLLM、AIエージェントの情報交換ができた。声掛けてくれた皆さんありがとうございました! scrapbox.io ライブ生成がギリギリ間に合ってよかった。Blooming Campでミャクミャクが生まれた…
コメダ珈琲 カラムーチョ チキンバーガー でかい!
MCP完全に理解した。理解したそばから古い知識にはなりそうだけども。— daiiz (@daizplus) 2025年4月9日 GitHubで提供されているModel Context Protocol(MCP)のスキーマ定義ファイルをPDF化してPhonnoに取り込んで読んだ。 github.com 気になる箇所をLLMに解説してもらいながら勉強を進めていける。 画像の領域を指定してAIに説明してもらう例。人間が説明を書くこともできる。検索強化のためにメタデータとしても使用される。 ソースコード中の型定義とコメントを駆使して思考チャートを作れる。 ResourceTemplate型の図解 サー…
まだ壊れたWi-Fiルーターの買い替えができていなくて、有線LAN接続されたPixel Foldが代役を頑張っている。 "イーサネット。"
京都に帰ってきた。大混雑。みんな万博行くのかな。 東海道新幹線 京都駅 駅でミャクミャクを見すぎてポン・デ・リングを食べたくなった。ミスドで珈琲休憩。クレジットカード決済できるようになっていた。 ポン・デ・宇治抹茶 黒糖わらびもち
Helpfeel Tech Conf 2025、無事に終了しました!お疲れ様でした!! 資料の公開準備が整ったら登壇レポートを書きます📑 各自好きなイラストを描けるタイプの名札 左上から時計回りに、Helpfeelロゴ、Gyazo忍者、Cosenseビーバー
明日のイベント登壇に向けて東京入りした。 去年の発表の続きとして話ができそう。告知しておいた。 Helpfeel Tech Conf 2024での発表の最後で研究中の取り組みとして触れた、意図予測検索の進化系の話をします。 (画像は去年のスライドです)#helpfeel_tech https://t.co/DKryiSzsB3 pic.twitter.com/7uaCUCOXoE— daiiz (@daizplus) 2025年4月10日 通し練習はするものの、完璧なカンペを用意するよりもその場のノリで話を組み立てる方が好き。ただ、伝えようと思っていたことが抜けてしまうのは良くない。伝えるべき…
突然体調が戻ってきた。杉とヒノキの花粉に振り回されている。来年は対策を考えたいところ。金曜日のイベントで使う発表資料の手直しをした。たぶんいい感じ!マウスのホイールがキュッキュと鳴いている。 普段睡眠が足りなすぎて保留になっていたアップデートパッチがこのダウン期間で一気に当たった感じがする— daiiz (@daizplus) 2025年4月9日 セブンイレブンのラーメンサラダ ラーメンサラダのメンサの部分 Google AI StudioでGemini 2.5 ProにRAGの説明用の図を描いてもらった。一発でこれを出せるのすごいと思う。SVGで出力しているので編集も簡単。 RAG(Retr…
ハンバーガーの包装紙にEthernetアダプターが繋がれているユーモラスな画像。木目のテーブルの上に置かれている。
花粉症をこじらせてダウンしております。お粥を食べます。— daiiz (@daizplus) 2025年4月7日 たまご雑炊美味しい。ケンタッキーのフライドチキン食べたい。回復しつつある。
画像ページにおいて、関連画像リストに関する思考チャートも生成できるようになった。下図の例のように、論文の1ページ目でこの機能を実行することで、論文全体を通して重要な知識の概要を構造化できる。関連画像欄にはこの論文の他のページに加えて、別途収録したコンテンツがサジェストされており、これらを有効活用できる。 Related imagesに基づくフローチャート Claude Codeによるアピールタイム 今回のメイン実装担当者であるClaude Code氏のコメントです。 「Ask the Flow」の新オプション「Related images」で複数の関連画像の知識を一度にグラフ化 画像間の共通テ…
一日中寝ていた。そしてまた寝る。おやすみ世界。
Phonnoの開発でClaude Codeを使い始めた。Dockerコンテナ内で動かせるので安心安全。明日からたくさん働いてもらうぞー! Claude Code 起動成功 力試しとして、昨日の記事で紹介した機能の実装をソースコードから探して説明してもらった。だいたい合っている気がする。Box Descriptionと命名してしまったけれどClaudeが書いているBox Overviewのほうがいいな。 daiiz.hatenablog.com # Claude日記: Box Overview Generation機能の調査 ## 2025-04-04 ### 機能概要 - ブログ記事「http…
Boxに収録されている画像ソースをざっくり理解して、概要を生成できるようになった。画像を新たにアップロードしたときや、雑多なテーマを扱っていて様々な切り口から書けそうなときは適当なタイミングで再生成される。 概要を書くためにLLMが一度に読めるコンテンツ量には限りがあるので、でかいデータセットの場合はランダムに選択している。無作為に選ばれた画像郡から新しい概要を作り、既存の概要とミックスする。この二段構えにすることで、過去の生成結果も適度に取り込みつつ新鮮さも得られていい感じだった。ランダム凝縮と名付けた。GraphRAGのコミュニティ要約のアプローチも気になるので時間をみつけて実験してみたい…
良いニュースと悪いニュースがある。 悪いニュース 行きつけのすき家が閉まっていてモーニングを食べられない Kyashに残高を回収されていた Kyashに500円ほど吸い込まれた模様— daiiz (@daizplus) 2025年4月2日 Kyashのアカウントは閉鎖されていて直接は確認できていない。連携していたマネーフォワードでわかった。もうそこにはない星を時差で見る天体観測のようだ。星が崩壊したあとに発生した粒子を観測できるかもしれないからもう少し見ておこう。 個人開発のGCPの先月の請求が3000円も増加した Artifact Registryの利用料(オレンジ色)だった daiiz.h…
今日の日付画像での、年度初め恒例の桜イラスト。このデザインももう5年目だ。来年は差し替えようかな。2025年度も頑張りましょう!
「ブログリーダー」を活用して、daiizさんをフォローしませんか?
昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
写真をWhiskで画風変換して、Veo 2で動画生成した。 すき家で食べたエビのビスクソースカレー 喫茶宇宙 フルーツサンドパーティー Whisk APIほしいな〜
眠すぎる!!!!先週の月曜日も眠かった。今日はオフィスに行ったのでまだ救われていた。 daiiz.hatenablog.com 雨上がりのアイスコーヒー。ローソンの紙コップが夏仕様になって朝顔が咲いていた。 今月も毎日何かしら書けてよかった。いま振り返ったら一記事多かった。WWDCの日に二つ書いていたようだ。うるう記事。 2025-06-10から1日間の記事一覧 - #daiizメモ この記事みたいなしょうもない内容であっても、続けることが大事。一日さぼるだけでもエンジンがかかりにくくなってしまう。いざガッツリ書きたい日に何もできなくなってしまう。書ける日を万全の態勢で迎えるためのメンテナンス…
Phonno Legacyの「この日、この場所」機能がパワーアップした。写真がメタデータとして持っている撮影日時と地理情報の組を利用すると、一連の写真記録を自動で複数の塊に分けることができる。時間的な連続性と地理的な離散性をうまく組み合わせた結果、いい感じに動いている。 GUIでの表現としては、ナビゲーションボタンを配置して、パラパラ漫画のような見せ方が実現できたりする。これもこれで思い出の振り返りUIとして大変便利だが、システム的にはデータ全体を部分的なチャンクに分けて理解できることの価値が大きい。 熱海旅行: 京都駅から熱海の旅館までの記録 Long contextを活かしたLife co…
今日は昼に起きてから、あのお店で中華を食べることだけを目標にして生きていた。Uber Eatsで何度か注文して好きになった四川料理のお店。なんか何を頼んでも美味しい。Uber Eatsでリピートした店は、なるべく店舗での食事も体験したい派。その店があるその町の雰囲気ごと楽しみたい。事前体験で一番のお気に入りメニューはこれ。 辣子鸿丁/ 鶏肉唐揚げのピリ辛炒め Spicy 夕方遅くに涼しくなって来た頃合いを狙って、30分ほど歩いて行ってきた。バスを使ってもいいけれど、久しぶりの新開拓エリアなので歩きたかった。大通りをひたすら歩く。途中まではよく見知った景色だけど、普段使っている道と少しずれること…
図: 時系列画像リストの操作 図: 平均よりちょっと上の成果を繰り返し得ることで、ときどきよい発見をする
昨日インストールしたGemini CLIを使ってみている。 daiiz.hatenablog.com コーディングエージェントの本質とは全く関係ない話だが、文字のグラデーションが格好いい。自作のAIエージェントOkonomiでもやりたい。 Gemini CLIはオープンソースなのでGitHubでコードを読める。特徴的な文字列「Agent powering down.」で検索して実装箇所を探してみる。やっぱりInkを使っているようだ。文字のグラデーションにはink-gradientを使っていた。 import Gradient from 'ink-gradient'; <Gradient col…
Gemini CLIをインストールした。 Google announces Gemini CLI: your open-source AI agent GitHub - google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal. Gemini 2.5 Proを使えるのは強そうだ。
去年買ったSurface Laptopについにリコール機能がやってきた!完全なプライベートでの開発端末なので迷うことなく有効化した。 しばらくこのまま放置して、歴史が溜まったころに使い勝手をレビューします。バックグラウンドで定期的にスナップショットが撮られる体験、何も悪いことをしていないのになんか緊張する。Macのタイムマシン機能よりも緊張するのは、ファイルデータではなくて画面全体のスクリーンショットの連続保存だからだと思う。「何を持っているか」ではなくて「何をしたか」が赤裸々に蓄積される新感覚。楽しみです。 アイスコーヒー 眠くなったら駆け込む場所。今日の店内は冷房が強くて少し寒かった。
先週の月曜日と同じく、朝起きた途端からすでに限界。今週もなんとか乗り切りたい。 daiiz.hatenablog.com
日-曜-日。昼過ぎに起きた。生活リズムが崩壊している。 フィレオフィッシュ - daiiz² フィレオフィッシュの構造式 - ChatGPT¹, daiiz² フィレオフィッシュの構造式(3D)- ChatGPT¹ ¹ OpenAI, ² TeamJ
嬉しかったこと。夜に食べた塩トロ鯖開き弁当の鯖が大きかった。こんなに満足感のあるお弁当を見たのは久々だった。あらゆるものが小さくなっている現代でこれに出会えて感動した。京都ポルタのヒモノ照ラスさんにて。 Touch ID搭載のMagic Keyboardを買った。高級品だけど、なんだかんだ純正が一番しっくりくるので逃げずに買う。Mac mini導入計画の第一歩。生まれてこの方、デスクトップマシン環境で本格的なソフトウェア開発をやったことがない*1ので、購入前にまずは慣れられるかを検証していきたい。憧れの環境。いま使っているMacBook Airをクラムシェルモードにして疑似的に体験してみる。 …
同僚とコメダ珈琲。今週もお疲れ様でした。 クロネージュ
ソフトバンク回線利用特典の1年間の無料期間が終了したのでProプランから引退した。Perplexityは検索体験を徹底的に研究しているAIプロダクトとして、登場当初はかなり期待していた。Google検索の代わりに積極的に使ってみたり、ブックマークや記事の共有機能も試していた。 Proマークが消えた様子 しかし、ChatGPTやGeminiなどの大手汎用AIがウェブ検索機能を充実させてきたり、GoogleにSGE (AI Overview) が搭載されたここ最近は、残念ながらほとんど起動しなくなってしまった。いま振り返ると、ChatGPTとほぼ同時期にリリースされたDeep Researchの精…
暑すぎる 空を使った扇風機 - ChatGPT¹, daiiz² ¹ OpenAI, ² TeamJ
ここ2, 3ヶ月くらい、生活に必要な体力のすべてを非常用バッテリーで賄っている感じがする。非常用の低エネルギーでもこここまで動けていて、それなりの生産性を維持できているのはすごいことだ。あとどれくらい持つのだろうか。 ✅️ ヤマト運輸の営業所に技術書典あての本を持ち込んだ ✅️ コードを書いた ✅️ コードをレビューした ✅️ 新しく見つけたお店でカレーを食べた イエローカレー
週の初めはパフォーマンスがよくない。 ✅️ 起きる ✅️ 発送指示書を印刷する ✅️ 発払い伝票を書く ✅️ コードを書く
この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛くなかった、残念。チキンサラダが美味しかった。食後に眠気が襲ってこなかったのでサラダ生活を始めようか。 技術書典18、無…
ChatGPT o3(ウェブアプリ)で写真から文字の領域を切り出して文字画像を作る実験。さて、オリジナルの写真は何でしょうか!? 日常風景から文字を集めるアプリを作りたい。
今週もお疲れ様でした!! 缶ビールをカシュッと開けたらClaudeのロゴのアメーバみたいな飛沫(しぶき)ができた記念。 Claude Max プランを契約しようかと迷っている今日このごろ 芸が細かい。
こういう時代なので作りたいものや試したいアイデアは山ほどあるのだけど、いまいちモチベーションが高まらない。自分に何を求められているのかも見失いつつある。もっと盛り上げていきたいけれど、実は方向性を間違えているのかもしれない。いまはひたすらに頑張って向き合って、刺激を取り戻したい。