昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
今月は安定してコードを書けた。 お疲れさまでした! 千疋屋 苺のムース
京都に帰ってきた。 新横浜駅にて。 京都駅にて。八条東口から出たほうが地下鉄への乗り換えは便利なのだけど、雰囲気が明るいこっち側を使いがち。 日常の何気ない瞬間を積極的に写真に残していきたい。
南町田グランベリーパーク
来月上旬の Helpfeel Tech Conf 2025 での登壇に向けて散髪してきた。髪型がより自然な雰囲気になるために2週間のバッファを設けている。そろそろ発表資料を書かないと! 発表資料を書いていこう! https://t.co/78cMqj6Rfv— daiiz (@daizplus) 2025年3月28日 帰りにベローチェでドライカレーを食べた。 本日の京都タワー。標準カラーでのライトアップの姿。 昨晩はAIと会話して夜更かししてしまったので今日は早く寝たい。
Claude DesktopでModel Context Protocol (MCP) サーバーを接続し、ローカルファイルを操作できるようになった。自分の関心領域としてMCPの世界にどれだけ深入りするかはまだ分からないものの、漠然と苦手意識を持ちたくない、かつ、議論にはついていきたいので人並みに触っていきたい。思いがけないアイデアを閃く可能性にも期待している。今日のところは @modelcontextprotocol/server-filesystem を使ってチャットログを書き出したり、超小規模なRAGみたいなことができた。次はこれの実装を読んでオリジナルなサーバーを書きたい。 タスクバーに…
Duolingoで数学(まだ算数レベル)をやっている。50日続いた。四則演算の表現方法がなんか独特な世界観で面白い。ブロックを5, 10区切りで数える癖をつけさせようとしている感じがする。例えば正解が「27」になる問題では、でかい塊が2つあって半端なブロックが2個転がっているやつを選べばいい。視覚的に即答できるようになってくる。 答えをズバリ数字として入力するだけでなく、数直線上でスライダーを動かして答える問題も多い。おかげで四分の一の場所をピンポイントで選ぶのがうまくなった。 このゆるい世界観でどこまで難しい問題に挑めるのか、不安を抱きつつも続けてみる。いまのところは文章題の英語の理解の方が…
実世界で見聞きしたもの、食べたもの、体験したこと、考えたことを全部LLMのコンテキストに載せたい。人生を記述して、対話を可能にし、自律的に新しい作品を生み出すための技術を探究していこう。プロジェクト life.txt、ここに始動。 Long ≪ Life context
カレー、タイ米、月曜日
PDF画像のページ送りに対応した。Phonnoでは、PDFファイルがアップロードされたとき、各ページを画像に分割して保存している。この際にページ画像の順序を保持しているため、前後のページに移動できる。データ構造的には独自のドキュメントビューワを作るための下準備が整っている。あとは時間をみつけてイケているUIを書いていきたい。 気の向くままに検索してもっともらしい画像に着地したのち、周辺ページを読み進めて前提知識や関連情報を獲得できる。 移動時のガタツキもなるべく早くなんとかします。
急に暑くなった! 22度!?— daiiz (@daizplus) 2025年3月22日 洗濯が捗ったのはよかったけれど、とにかく目が痒い!!
NotebookLMにマインドマップ機能が追加されていた。 Phonnoで研究開発中の思考フローチャート生成も負けていられないな! daiiz.hatenablog.com グーグルに先駆けて似たものを出せていたのは先見の明がある感じがしてなんか嬉しい。
まだまだ寒い。花粉症で頭の回転が悪いなりにコードを書きまくった一日だった。焼きそばを食べて寝よう。
Geminiに改行爆弾を送り込まれることがあって困っている。 結構な頻度でGeminiに改行爆弾を送り込まれることがあって困っている pic.twitter.com/8vy1IiwpqU— daiiz (@daizplus) 2025年3月19日 pic.twitter.com/dJNtxCJD4n— daiiz (@daizplus) 2025年3月11日 こちらは-1爆弾。 pic.twitter.com/bEQq5YhMKM— daiiz (@daizplus) 2025年2月26日 出力トークン長をめいっぱい使って送ってくるので待ち時間も長くなる。この文字列が課金されるのも気に食わない…
自宅のWi-Fiルーターが壊れてしまった。本日は有線接続でお送りします。 持っててよかったEthernet to USB-C変換ケーブル。
個人開発で運用している複数のGCPプロジェクトで警告が出ていた。いよいよ期限が迫っているので着手。ドキュメントを読みつつ提示されたコマンドを実行するだけで無事に移行できた。新たな環境での権限付与のレビューだけ大変だった。Container Registryに保存されていたDocker imageが全部コピーされて時間がかかった。もはや参照されていない古いやつは予め消しておけばよかった。2022年の懐かしいimageも出てきた。 対応完了した。「今日の日付」画像、点描画変換ツール、miilClient、Phonno、Chronicle、Snapshot machineなどがすべて救われた。めでた…
午前中は開発の議論をして、午後は鎌倉でフレンチイタリアンをいただいた。 小学校の遠足ぶりの小町通り ブイヤベース、牡蠣、セロリの新芽 サーモン、バジル、マンゴーソース。クラスタリングの可視化を思い出した。 daiiz.hatenablog.com daiiz.hatenablog.com 鯖、マンゴー、カリフラワーソース モチモチ食感のパスタ、猪肉のラグー。猪肉のRAG。この料理と一緒に出されたワインが好きだった。写真を撮り忘れた。 めっちゃ美味しい豚肉 2種類のチョコレート
夕方まで爆睡したあと、藤沢で id:kanata_02くんとディナーしてきた。技術書典18に無事当選できたので出展の作戦会議をはじめた。TeamJとしての初の現地参戦*1を最大限に楽しめるよう、なんとしても新刊を書きたい。執筆スケジュールを綿密に組もう。他にも万博やWWDC、Mac miniの話もできてよかった。 写真を正方形で撮る(あとから切り抜くするのではなく最初から正方形で保存する)話を聞いて、試してみた。普段と構図の決め方が変わってきて難しい。まったく関係ないのに無意識にスマホの向きを変えたりしていた。言われてみればたしかにmiilやInstagramに投稿することを考えると長方形で撮…
今週末は藤沢〜鎌倉エリアに滞在予定。慶應義塾湘南藤沢キャンパスで開催された増井先生の最終講義に出席してきた。 京都に帰ったら改めてレポートを書きたい。 聴講者による最終講義の実況: https://x.com/hashtag/masui_last_lecture?src=hashtag_click
3ヶ月ぶりにGeminiに感動した。前回の感動はこちら: daiiz.hatenablog.com 今回もGoogle AI Studioでのできごと。アップロードした画像をテキストで編集できるようになった。加工したい内容をプロンプトで指示するだけで画像を生成してくれる。指示と関係ない箇所はほとんど変更されない。これがすごい。 Google AI StudioでのImage Editingのデモ。クロワッサンにチョコソースをかけるよう指示している。 ここまで綺麗に画像の大部分を維持して望み通りの編集をしてくれるツールは初めて見た。素人ユーザーとしてはPhotoshopでも難しかったと思う。 ほ…
マクドナルドのハッピーセットで、チキンナゲットのおもちゃをゲットした。 ハッピーセットのチキンナゲットのおもちゃゲットした pic.twitter.com/iT2Jx2KnOI— daiiz (@daizplus) 2025年3月12日 自作のナゲット形状分類器にもかけてみる。全体的に丸みが強いせいで判別に苦戦していた。これまでの実験では、本物のナゲットに対しては、RGBフルカラー写真で学習したモデルで最もよい結果が得られる傾向があった。しかし今回のおもちゃを対象にしたときは、輪郭線画像データで学習したモデルが安定していた。また、いずれのケースにおいても二値化画像(白黒画像)のモデルはほとんど…
PDF文書の入力に対応しました。ファイルを選択するだけで、全ページが自動で画像化されてPhonnoに取り込まれます。 つぎは、対象の題材をとことん読んで理解するための支援機能を作りたい。せっかくLLMという最強の武器を手に入れたのだから、概要を雰囲気で把握するのではなくて、完全に納得できるまで寄り添ってくれる文書・画像ビューワを目指したいところです。超検索型ドキュメントビューワ。
マクドナルド、モスバーガー、ケンタッキーをだいたい攻略したので、次はロッテリアに進出していきたい。ハニーマスタード チキンフィレバーガーを食べた。美味しい。フライドポテトも好みのタイプでいい感じだった。 撮影: Pixel 6a、加工: Foodie
春の服を見てきた。とは言ってもまだ急に寒くなったりするので油断はできない。冬のコートをクリーニングに出すのももう少し待ったほうがいいかもしれない。 花粉症のせいでものすごく眠くて、思考力がGPT-3.5 Turboくらいになっている。体調が万全でないときは深く考えないほうがいい。これまでの経験でようやくわかってきたけれど、ここでなんとか力を振り絞って複雑なことをやったとしても、後からほとんどやり直す羽目になる。さほど頭を使わなくても淡々とこなせることだけをやって、あとは寝ておくに限る。 こんな状況でもWhiskは楽しめる。 daiiz.hatenablog.com https://x.com/…
検索画面の画像リストのSkeleton loadingを実装した。これまでは画像リストの初期高さが0pxであったため、画像の読み込み完了前後でガタツキ(レイアウトシフト)が大きかった。全体的にだいぶ良くなった。あとは説明文とキーワードサジェスト領域も同じように対応できたら完璧だ。 Chrome Dev Toolsで Slow 4G 回線をシミュレーションした様子。 おまけ 個人開発のGitHubリポジトリにGemini Code Assistをインストールおり、AIにコードレビューに参戦してもらっている。自動生成されるPull Requestのサマリーで英語を勉強できる。今日は jarring…
外出時に持ち歩いているメモ帳。コンビニで売っているやつ。ふと思いついたアイデアを書き留める。大事なページはコピーして自宅のフォルダで保管する。見開きでコピーするとき、B5紙面に収まるように拡大するには 123% (ほぼA5 -> B5) を指定すればいい。語呂が良くて覚えやすい。コピーを終えたらページをミシン目で切り取って破棄する。街中で落としても安心! www.kokuyo-st.co.jp カットオフノート5号(A6)中横罫48枚 ● 必要なページだけをきれいに切り離せる、ミシン目入りのカットオフタイプ。 ● 特殊フィルムでラミネート加工したクロスを採用。背が破れにくいだけでなく、ボールペ…
京都駅のカフェでパンケーキを食べた。 AIがコードを書いてくれるようになったら、パンケーキとハンバーガーを巡る旅をしたい。
Phonno: キーワードの概要パネルにも思考チャートを表示する
表題の通り、キーワードの解説が生成されるパネルに、関連用語や関連概念を示すフローチャートが表示されるようになりました。Ask the Flow機能の発展形です。現状ではリアルタイムで生成するため少々時間がかかりますが、生成結果の保存と再利用の仕組みを(AIが)実装中なのでそのうち爆速になります。 Bigtableに関する知識整理の例 daiiz WikiでのChatGPTに関する説明の例(デモ) その他のアップデート 画像配信: 大量のサムネイル画像が読み込まれる検索画面が安定しました。初期描画完了までの時間が短縮されます。Cloudflare R2オブジェクトのPresigned URLを作…
大学時代からの友人が久しぶりに京都に来たので飲んできた。僕が大学院を中退して地元から引っ越したりといろいろあったけれど、知り合って12年経ったいまでも、こうして定期的に会って盛り上がれるのは本当にありがたい。 daiiz.hatenablog.com
花粉症で目が痒くて文字を読むのがしんどい。Deep Researchの長文レポートをポスター形式でまとめて一撃で概要を把握したい。ウェブUIから o3-mini-high、Claude 3.7 Sonnet、Gemini 2.0 Flash Thinking を試してみた。自分でロジックを組む前に、何事もまずはAIの実力に任せてみて課題を探るのがいい。ということで情報の取捨選択からレイアウトまでやってもらう。プロンプトを調整すればもっといいものが出るだろうが、今後の開発戦略を考えるためのベースラインということで。 入力内容 Deep Researchの結果(Markdown形式のテキスト) プ…
トンカツを食べようと思って出掛けたが、お店を間違えて海鮮丼になった。
Phonnoでの思考フロー生成(Ask the Flow)機能が誰でも使えるようになりました🎉 検索画面と画像プレビュー画面でフローチャートを生成できます。 API料金の都合でこれまではログインしているユーザーのみに開放していましたが、今日からはログイン状況に関わらず利用できます。ボックスの編集者だけでなく、検索専用ビューの利用者にも触ってもらえるので嬉しいです! GPT-4o, o3-mini, Claude 3.5 Sonnet と試してきましたが、精度はそこそこ満足できても料金や速度面で課題が残っていました。先日 Gemini 2.0 Flash が一般提供開始されたことで選択肢が増え、…
「ブログリーダー」を活用して、daiizさんをフォローしませんか?
昼は暑く、夕方は雷雨。今年も夏がはじまった。 烏丸丸太町の空 ビビッド Generated with Whisk and Veo 2
写真をWhiskで画風変換して、Veo 2で動画生成した。 すき家で食べたエビのビスクソースカレー 喫茶宇宙 フルーツサンドパーティー Whisk APIほしいな〜
眠すぎる!!!!先週の月曜日も眠かった。今日はオフィスに行ったのでまだ救われていた。 daiiz.hatenablog.com 雨上がりのアイスコーヒー。ローソンの紙コップが夏仕様になって朝顔が咲いていた。 今月も毎日何かしら書けてよかった。いま振り返ったら一記事多かった。WWDCの日に二つ書いていたようだ。うるう記事。 2025-06-10から1日間の記事一覧 - #daiizメモ この記事みたいなしょうもない内容であっても、続けることが大事。一日さぼるだけでもエンジンがかかりにくくなってしまう。いざガッツリ書きたい日に何もできなくなってしまう。書ける日を万全の態勢で迎えるためのメンテナンス…
Phonno Legacyの「この日、この場所」機能がパワーアップした。写真がメタデータとして持っている撮影日時と地理情報の組を利用すると、一連の写真記録を自動で複数の塊に分けることができる。時間的な連続性と地理的な離散性をうまく組み合わせた結果、いい感じに動いている。 GUIでの表現としては、ナビゲーションボタンを配置して、パラパラ漫画のような見せ方が実現できたりする。これもこれで思い出の振り返りUIとして大変便利だが、システム的にはデータ全体を部分的なチャンクに分けて理解できることの価値が大きい。 熱海旅行: 京都駅から熱海の旅館までの記録 Long contextを活かしたLife co…
今日は昼に起きてから、あのお店で中華を食べることだけを目標にして生きていた。Uber Eatsで何度か注文して好きになった四川料理のお店。なんか何を頼んでも美味しい。Uber Eatsでリピートした店は、なるべく店舗での食事も体験したい派。その店があるその町の雰囲気ごと楽しみたい。事前体験で一番のお気に入りメニューはこれ。 辣子鸿丁/ 鶏肉唐揚げのピリ辛炒め Spicy 夕方遅くに涼しくなって来た頃合いを狙って、30分ほど歩いて行ってきた。バスを使ってもいいけれど、久しぶりの新開拓エリアなので歩きたかった。大通りをひたすら歩く。途中まではよく見知った景色だけど、普段使っている道と少しずれること…
図: 時系列画像リストの操作 図: 平均よりちょっと上の成果を繰り返し得ることで、ときどきよい発見をする
昨日インストールしたGemini CLIを使ってみている。 daiiz.hatenablog.com コーディングエージェントの本質とは全く関係ない話だが、文字のグラデーションが格好いい。自作のAIエージェントOkonomiでもやりたい。 Gemini CLIはオープンソースなのでGitHubでコードを読める。特徴的な文字列「Agent powering down.」で検索して実装箇所を探してみる。やっぱりInkを使っているようだ。文字のグラデーションにはink-gradientを使っていた。 import Gradient from 'ink-gradient'; <Gradient col…
Gemini CLIをインストールした。 Google announces Gemini CLI: your open-source AI agent GitHub - google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal. Gemini 2.5 Proを使えるのは強そうだ。
去年買ったSurface Laptopについにリコール機能がやってきた!完全なプライベートでの開発端末なので迷うことなく有効化した。 しばらくこのまま放置して、歴史が溜まったころに使い勝手をレビューします。バックグラウンドで定期的にスナップショットが撮られる体験、何も悪いことをしていないのになんか緊張する。Macのタイムマシン機能よりも緊張するのは、ファイルデータではなくて画面全体のスクリーンショットの連続保存だからだと思う。「何を持っているか」ではなくて「何をしたか」が赤裸々に蓄積される新感覚。楽しみです。 アイスコーヒー 眠くなったら駆け込む場所。今日の店内は冷房が強くて少し寒かった。
先週の月曜日と同じく、朝起きた途端からすでに限界。今週もなんとか乗り切りたい。 daiiz.hatenablog.com
日-曜-日。昼過ぎに起きた。生活リズムが崩壊している。 フィレオフィッシュ - daiiz² フィレオフィッシュの構造式 - ChatGPT¹, daiiz² フィレオフィッシュの構造式(3D)- ChatGPT¹ ¹ OpenAI, ² TeamJ
嬉しかったこと。夜に食べた塩トロ鯖開き弁当の鯖が大きかった。こんなに満足感のあるお弁当を見たのは久々だった。あらゆるものが小さくなっている現代でこれに出会えて感動した。京都ポルタのヒモノ照ラスさんにて。 Touch ID搭載のMagic Keyboardを買った。高級品だけど、なんだかんだ純正が一番しっくりくるので逃げずに買う。Mac mini導入計画の第一歩。生まれてこの方、デスクトップマシン環境で本格的なソフトウェア開発をやったことがない*1ので、購入前にまずは慣れられるかを検証していきたい。憧れの環境。いま使っているMacBook Airをクラムシェルモードにして疑似的に体験してみる。 …
同僚とコメダ珈琲。今週もお疲れ様でした。 クロネージュ
ソフトバンク回線利用特典の1年間の無料期間が終了したのでProプランから引退した。Perplexityは検索体験を徹底的に研究しているAIプロダクトとして、登場当初はかなり期待していた。Google検索の代わりに積極的に使ってみたり、ブックマークや記事の共有機能も試していた。 Proマークが消えた様子 しかし、ChatGPTやGeminiなどの大手汎用AIがウェブ検索機能を充実させてきたり、GoogleにSGE (AI Overview) が搭載されたここ最近は、残念ながらほとんど起動しなくなってしまった。いま振り返ると、ChatGPTとほぼ同時期にリリースされたDeep Researchの精…
暑すぎる 空を使った扇風機 - ChatGPT¹, daiiz² ¹ OpenAI, ² TeamJ
ここ2, 3ヶ月くらい、生活に必要な体力のすべてを非常用バッテリーで賄っている感じがする。非常用の低エネルギーでもこここまで動けていて、それなりの生産性を維持できているのはすごいことだ。あとどれくらい持つのだろうか。 ✅️ ヤマト運輸の営業所に技術書典あての本を持ち込んだ ✅️ コードを書いた ✅️ コードをレビューした ✅️ 新しく見つけたお店でカレーを食べた イエローカレー
週の初めはパフォーマンスがよくない。 ✅️ 起きる ✅️ 発送指示書を印刷する ✅️ 発払い伝票を書く ✅️ コードを書く
この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛くなかった、残念。チキンサラダが美味しかった。食後に眠気が襲ってこなかったのでサラダ生活を始めようか。 技術書典18、無…
ChatGPT o3(ウェブアプリ)で写真から文字の領域を切り出して文字画像を作る実験。さて、オリジナルの写真は何でしょうか!? 日常風景から文字を集めるアプリを作りたい。
今週もお疲れ様でした!! 缶ビールをカシュッと開けたらClaudeのロゴのアメーバみたいな飛沫(しぶき)ができた記念。 Claude Max プランを契約しようかと迷っている今日このごろ 芸が細かい。
こういう時代なので作りたいものや試したいアイデアは山ほどあるのだけど、いまいちモチベーションが高まらない。自分に何を求められているのかも見失いつつある。もっと盛り上げていきたいけれど、実は方向性を間違えているのかもしれない。いまはひたすらに頑張って向き合って、刺激を取り戻したい。