びっっくりするくらい眠い アイスコーヒーでも勝てない 残念!!!
びっっくりするくらい眠い アイスコーヒーでも勝てない 残念!!!
技術書典18の商品ページを書きました。6月1日、池袋・サンシャインシティ 展示ホールD(文化会館ビル2F)、せ-02 TeamJ でお待ちしています! 新刊🎁 techbookfest.org 検索ネタの既刊📚️ 技術書典のストアでは新刊扱いになっていますが、初出は過去の技術書博覧会です。 techbookfest.org techbookfest.org 画像ネタの既刊📖 techbookfest.org techbookfest.org
京都に帰ってきた。 京都駅のスタバで技術書典のストアに原稿をアップロードした。
EXPO 2025 大阪・関西万博に行ってきた。一回目。id:kanata_02と一緒にまわった。取り急ぎ思い出の写真たちを。ネタバレにならない(すでにインターネットに出回っていそうな)範囲で。特にコモンズ館の各国の展示品はどれも魅力的で気に入ったものがたくさんあったけれど、初見で実物を見たほうが良いと思うので、いまは敢えて詳しく書かないでおく。スマホやパソコンの壁紙にして日常で触れていきたい。 シグネチャーパビリオン null2。抽選に落ちたので中には入れていない。建物の外観は昼も夜もかっこいい。唸っていて可愛い。ちなみにkanataくんは当選していたのでレポートを期待している! 大屋根リン…
大阪城を眺めています。 海老と蛸とガーリックトーストが美味しかった。 海老 リターンズ 京阪プレミアムカー 原稿、整いました。明日入稿します。
頑張っています。明日未明には仕上げたいところ...! 生成AIによるミャクミャク様バリアント(サーカス隊ふう)
東京駅でハッピーターンのイベント展示やっていた。 このクッションほしい。 京都に帰ってきた。
技術書典18の新刊の表紙は、クリーム色です。
6月の技術書典で頒布する新刊『LLM時代の検索を考える観察日記 2』を書ききった。原稿が終盤に差し掛かると、ページ数を4の整数倍に合わせる微調整に苦労する。ここから原稿チェックと修正の作業に入ります。誤字脱字や不適切な表現の検査はAIの力も借りれそうなので、前回よりもスムーズに進むと思う。オンラインストアとお品書きも準備しないと! いくつか収録を諦めた項目もあるけれど、いまのうちに書いておきたいことはだいたい入れられたのでよかった。昨夜から今日にかけてGoogle I/Oが行われているので、また大きく歴史が進む。おそらくMicrosoftやOpenAIからも追従してビッグニュースが出てくるだろ…
今日も頑張って生活しました。 存在しているだけで精一杯な日ってあるよね。 超低速でコードを書いたり本を書いたりした。 今日配信が始まったNotebookLMのスマホアプリをインストールしてみた。音声概要の再生プレイヤーみたいなUIになっていた。 すき家のナポリタン牛丼、美味しかった。 マクドナルドのベーコンポテトパイが販売期間終了っぽい雰囲気で悲しい。
クロワッサン鯛焼き さつまいもあん
お好み村 — お好み焼き屋がひしめき合うビル。生誕60周年! 昼はお好み焼きと牡蠣のバター焼きを食べた。 お好み焼きのワークフローを観察していた。 広島を満喫して帰ってきた。駅弁屋で穴子飯を買ったものの食べる間もなくあっという間についた。帰りはのぞみ号に乗れた。行きは間違えてひかり号に乗ってしまったけど、それでも体感時間は全く長く感じなかった。ひかりで大体2時間くらいで、これは普段よく使う京都-新横浜間ののぞみでの移動に相当する時間だ。西方向にも積極的に移動していきたい。 広島駅 駅弁は夕飯にした。穴子飯は人生初かも? 名古屋のひつまぶしも相当美味しかったけれど、こっちのほうがあっさりしていて…
こんばんは 本日の進捗 日記 広島に来ている。蒸し牡蠣。ポン酢とタバスコの組み合わせが旨かった。 蒸し牡蠣
こんばんはこんばんは 本日の進捗 印刷方式都合の最小構成20ページを超えられたので、なんとか本にはなれそうですね! 日記 Google DeepMindのAlphaEvolveに仰天した。これまでもAlphaGo、AlphaFold、AlphaTensorの成果を眺めては驚いてきたけど、AlphaEvolveは群を抜いてヤバそう。Alphaシリーズの問題設定が毎回うまくて感動する。 deepmind.google Alphabetという会社名、もしかして、Alphaシリーズの研究にbetするという意味を含んでいたりしない?
こんばんは 本日の進捗 睡眠失敗中なので書いていく。 日記 昨日から書いていた機能が仕上がってよかった。マクドナルドのベーコンポテトパイのパッケージが変わっていた。たまたま?
睡眠失敗が続いていて眠い!! 本日の進捗 なし。残念! 日記 めっちゃコードを書いて、事務作業もした。技術書典のオフライン会場でのサークル番号を把握。完全手ぶらセットも申し込んでみた。テーブルクロスや値札などのブース設営グッズをいただけるらしい。楽しみ。
首を寝違えてしまって左を向けない。真っ直ぐ前を向いて原稿を書けということだろう。 本日の進捗 まだタイトルだけのセクションもありますが、おおむね順調に進んでいます。 単純比較で前日比 +8 ページ。 日記 季節限定メニューの冷やしラーメンが始まって嬉しい。待ってました! 毎日通いたいくらい嬉しい。 優勝
今日から一週間は、執筆の進捗を共有する日記になります。前回の続編『LLM時代の検索を考える観察日記 Ⅱ』を書いていきます。(前作は下記のBoothショップで買うこともできますよ!) daiiz.booth.pm 差分を振り返っていたらBardがGeminiになっていたりと、2年弱の間に世の中が大きく動いてきたことを痛感する。収録したいことはたくさんあるけれど、着手も筆も遅いので厳選しないといけない。辞書の編纂委員になったみたいで楽しい。 Bard 懐かしい 文章のリズムを思い出すためにファミレスで読み直していた。やっぱりこの表紙の紙質は予備校時代を思い出せる。勉強熱心だった頃の自分を降ろしてき…
Phonno: Crop with AI機能をCloud Vision APIからGemini 2.5 Flashに差し替えた
背景 Gemini FlashのObject detectionやOCRの性能が向上したという噂を聞いたり、実際にGoogle AI Studioで遊んだりして可能性を感じていた。写真を入力として「犬・猫」や「ガラス製品」など検出対象が明確なタスクでは概ねうまく動く手応えがあった。今回はスクリーンショットに対して「画像の代表領域」「最も重要な領域」「価値の高い情報を提供する箇所」のような漠然としたクエリでの切り抜きができるかを検証したい。 daiiz.hatenablog.com Crop with AI機能 画像内の重要な領域を特定してアノテーション作成を補助するPhonnoの機能。これまで…
いろいろ食べているうちに、商品の英語名称を読むほうがシンプルということに気付いた。推したいことをピンポイントで伝えている。それと同時に結構な情報が失われていることも見えてきた。 どかっとテリマヨチキンパン → Teriyaki Chicken これは情報量はほぼ同じ。マヨネーズ要素が欠落してしまって勿体ないが。 手巻きソーセージドーナツ → Sausage ドーナツであることを諦めたなと思ったが、たしかによく考えるとこれ一般的にはドーナツとは言わないないのかも。 ツイストサンドマーガリン → Margarine 特に気になることはない。美味しい。 バタークロワッサンメロンパン → Butter…
久しぶりにオフィスの近くのCoCo壱番屋でランチ。期間限定メニューの炭火焼きチキンと和の出汁カレーを食べた。ふんだんに振りかけられた鰹節が踊っている。美味しんぼでもカレー対決で鰹節を削っているシーンがあった気がする。旨い。梅肉を添えたくなった。カレー自体がさっぱりしているので揚げ物をトッピングしてもいいかもしれない。 www.ichibanya.co.jp
木曜日、もくもくとコードを書く日。まだ実験段階なので特に語れることはないけれど、新しい検索アルゴリズムを考えている。Phonnoやナッジグラフ構想で必要になってくると目論んでいるやつ。本質的ではないものの、あると実験が捗るパーツをClaude Codeがどんどん書いてくれるのでありがたい。実装の変更前後での検索結果を精査するためのレポーティング機能とか、CLIツールのオプションとか。ログ出力で表組みや絵文字を多用してテンションも上げてくれる。そもそも成功するかわからないプロトタイプの段階においては、多少作り方が荒くてもいいものは任せていけるといい。 Claude Codeは、調子が乗ってくると…
下記の記事で提案した、LLM 時代の知的生産行動をいい感じにデザインするフレームワーク「ナッジグラフ」はGoogle検索しても何もヒットしない。まだ誰も考え出していないようだ。 daiiz.hatenablog.com 氷の中の何かを釣っているイエティの画像(div要素のaria-label属性より) 取り急ぎCosenseでページだけ作って発信しておいた。言葉を造る実績を解除した。Coin a phrase. Neologism. ナッジグラフの生みの親になった(2025/5/7 13:26 撮影)
Phonno (Ask the Flow): `Unsupported markdown: list` の修正
Phonnoの思考フローチャートで番号付きリストが解釈されなくなっていた。Unsupported markdown: listと表示されている。当該ノードは step1["1. すり鉢でごまを荒めにする"] のように、いたって普通に記述されている。 「食べ方の手順」が描画されることが期待される Mermaid-jsのv11系での問題のようだ。 Markdown lists are not supported · Issue #6099 · mermaid-js/mermaid · GitHub Markdown-by-default for labels complicates the upg…
烏丸五条 草間彌生 版画の世界、行きたい たぶん魔法界とマグルの世界を結ぶ扉
京都に帰ってきた。いい旅だった。ゴールデンウィークの後半戦はコードを書きます。頭が柔らかくなってアイデアの連想が止まらなくなっている。 Nudge Graph構想を進めていきたい。 ナッジグラフ(Nudge Graph)を設計・提唱したい。PhonnoやCosenseに蓄積された興味関心コンテンツと研究ノートを編み直し、LLM 時代の知的生産行動をいい感じにデザインできる気がする。— daiiz (@daizplus) 2025年5月4日
茶碗蒸し本舗 稲穂 紀州梅、明太子 めかぶ味噌 愛知に続いて、櫻坂46 5th TOUR 2025 “Addiction”の福岡公演。 daiiz.hatenablog.com マリンメッセ福岡 A館 A館 バクテリオファージみたいなオブジェ お酒がまわると川を撮りたくなる ADDICTION
新しいプロジェクトを始めた。最初からClaude Codeが参画している。まっさらな状態からコーディングを手伝ってもらった結果、$28も消費してしまった。 いろんなAIが寄って集って開発している。 お金はかかったけれど、数時間で超高速にたたき台が仕上がった。ここからは探究フェーズに入るので人間が頑張ることになる。明日は福岡。新幹線の中で進めよう。
chrome://で始まるようなChrome内部URLの画面を読んでいた。システムページっぽさのあるブックマーク検索画面や印刷画面、証明書ビューワなどが意外とHTMLで書かれていた。CSSやJavaScriptの勉強になる。chrome://chrome-urls/ で内部URLのリストが見れる。 chrome://chrome-urls/ chrome://intro/やchrome://terms/など、一度見たら最後で普段は目にする機会がないページをいつでも見れる。chrome://dino/にアクセスするとオフラインにならなくても恐竜ゲームで遊べる。chrome://topics-in…
有給休暇 1日目 Phonnoの開発が捗った。画像の視覚情報からグラフを構築する「Visual Meaning Graph」機能を試作して、ドッグフーディングを開始した。 Visual Meaning Graph #Phonno pic.twitter.com/LQ3p6302Cm— daiiz (@daizplus) 2025年4月30日 検索結果や画像ページで生成される思考チャートをMermaidのコードとしてエクスポートできるようになった。Cosenseにコードブロック記法で貼り付けやすくなった。 Phonno’s thought charts can now be exported a…
GPT-4との別れの日が近づいてきたので手紙を贈った。 Farewell and thank you, GPT-4 🌸 送別会もしたい。 GPT-4の送別会しないと pic.twitter.com/2vIaymslKn— daiiz (@daizplus) 2025年4月17日
街灯に寄生した道路標識を見つけた。ミャクミャク様かもしれない。
櫻坂46 5th TOUR 2025 “Addiction”の名古屋公演に友人と参戦してきた。細かい感想は千秋楽まで控えておくとして、超絶に最高だった!! ポートメッセなごや 終演後のステージ(写真加工済み) 終演後のステージ(写真加工済み) 規制退場の待ち時間にステージを撮らせてもらえる図らい、ありがたい。
こぼれいくら丼 黒ビールレーズントーストレアチーズ 名古屋のイメージとあっているワンカット
東京駅 八重洲中央口 新幹線終電 着席成功 京都に帰ってきた。
昨日に引き続き、本日のAIの無駄遣いを紹介します。ソースコードのタイポ TOOD -> TODO の提案をしてもらいました。ツイートにたくさんいいねが付いていて恥ずかしい。新幹線で揺られて書いたコードなのでこういうこともある!と言い訳しておく。 pic.twitter.com/Kw7C1Sa71D— daiiz (@daizplus) 2025年4月24日 中華食べた。美味しかった。 麻辣先生老四川麻婆豆腐、本場四川よだれ鶏、青山椒よだれ鶏
最近のo3モデルの無駄遣いを紹介します。 正多面体 → 正多明太 → せいためんたいくん です。かわいいね。
眠れない夜の散歩
眠すぎる。眠いけどうまく寝れない。寝るための力すら残っていないというのか!寝たら起きれる保証がないくらいのエネルギー残量だから寝ないようにしているとでも言うのか! ここ最近ずっと眠い眠い言ってる眠い— daiiz (@daizplus) 2025年4月21日
以前に環境を整えたClaude Desktopで試していく。JSON-RPC 2.0やModel Context Protocolの仕様もPhonnoでざっくり読んだので裏側で起きていることも想像できるようになった。いよいよ実物を動かして挙動を観察していくフェーズに突入。 daiiz.hatenablog.com daiiz.hatenablog.com 下記のサーバーをREADMEに従って追加する。コードを読むと import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js"; で実装されている…
松屋の店舗限定メニュー「水煮牛めし」を食べるためだけに山科(やましな)に行ってきた。前回の水煮と同じく、期待通りに美味しかった。牛めしと組み合わせることで松屋の強みをより活かした作品に仕上がっていた。水煮の辛さが若干手加減された感じはするものの、唐辛子と花椒の痺れ具合は健在だったのでよかった。 リピートしたいところだが、乗り換え有りの片道30分で通うのは大変そう。駅前の本屋とスタバの雰囲気も気に入ったことだし、週末だけならいいか? 水煮牛めし並盛 前回の水煮牛肉に挑戦した日記はこちら💁♂️ daiiz.hatenablog.com
Phonno: 画像の視覚的な説明生成機能でもo4-miniを採用
昨日に引き続き、OpenAIの新モデルの採用と調整を進めている。 daiiz.hatenablog.com 画像画面でDescribe with AIボタンから使える機能。画像の説明文がo4-miniで生成されるようになりました。これまでのgpt-4oよりも視覚的に読み取れる情報が丁寧に描写されます。ここで生成(もしくは手書き)した説明文は検索インデックス構築時にも参照されるため、手厚く書くことでより探しやすくなります。 画像の特定の領域に関する説明の生成結果の例 Phonno’s visual explanation generator for images & annotations no…
Phonno: gpt-4.1, o4-miniを部分的に採用
チャット用のモデルの選択肢のひとつであったo3-miniをo4-miniに更新した。 Phonno now supports o4‑mini! 🎉— daiiz (@daizplus) 2025年4月17日 長考型のモデルなので出力に時間がかかってもどかしいが、他のモデルと比べるとそれなりにポイントを抑えた端的な回答が得られる。薄い本『LLM時代の検索を考える観察日記』を収録したボックスにおける、クエリ「SGEの特徴は?」に対する答えの例を以下に示す。 o4-mini での回答(2025/4/18 時点) claude-3.7-sonnet での回答(2025/4/18 時点) また、検索画面…
LAPRASさんのイベント「【集え!関西エンジニア】いま熱いものLT大会」でLTしてきた。会場はグラングリーン大阪 北館、さくらインターネットさんのイベントスペース Blooming Camp。 bloomingcamp.sakura.ad.jp 発表資料はこちら。来場者に楽しんでもらえたようでよかった。これから大阪万博の会期中は毎日ミャクミャク様の変異体を生成していきます。懇親会でもSVGやLLM、AIエージェントの情報交換ができた。声掛けてくれた皆さんありがとうございました! scrapbox.io ライブ生成がギリギリ間に合ってよかった。Blooming Campでミャクミャクが生まれた…
コメダ珈琲 カラムーチョ チキンバーガー でかい!
MCP完全に理解した。理解したそばから古い知識にはなりそうだけども。— daiiz (@daizplus) 2025年4月9日 GitHubで提供されているModel Context Protocol(MCP)のスキーマ定義ファイルをPDF化してPhonnoに取り込んで読んだ。 github.com 気になる箇所をLLMに解説してもらいながら勉強を進めていける。 画像の領域を指定してAIに説明してもらう例。人間が説明を書くこともできる。検索強化のためにメタデータとしても使用される。 ソースコード中の型定義とコメントを駆使して思考チャートを作れる。 ResourceTemplate型の図解 サー…
まだ壊れたWi-Fiルーターの買い替えができていなくて、有線LAN接続されたPixel Foldが代役を頑張っている。 "イーサネット。"
京都に帰ってきた。大混雑。みんな万博行くのかな。 東海道新幹線 京都駅 駅でミャクミャクを見すぎてポン・デ・リングを食べたくなった。ミスドで珈琲休憩。クレジットカード決済できるようになっていた。 ポン・デ・宇治抹茶 黒糖わらびもち
Helpfeel Tech Conf 2025、無事に終了しました!お疲れ様でした!! 資料の公開準備が整ったら登壇レポートを書きます📑 各自好きなイラストを描けるタイプの名札 左上から時計回りに、Helpfeelロゴ、Gyazo忍者、Cosenseビーバー
明日のイベント登壇に向けて東京入りした。 去年の発表の続きとして話ができそう。告知しておいた。 Helpfeel Tech Conf 2024での発表の最後で研究中の取り組みとして触れた、意図予測検索の進化系の話をします。 (画像は去年のスライドです)#helpfeel_tech https://t.co/DKryiSzsB3 pic.twitter.com/7uaCUCOXoE— daiiz (@daizplus) 2025年4月10日 通し練習はするものの、完璧なカンペを用意するよりもその場のノリで話を組み立てる方が好き。ただ、伝えようと思っていたことが抜けてしまうのは良くない。伝えるべき…
突然体調が戻ってきた。杉とヒノキの花粉に振り回されている。来年は対策を考えたいところ。金曜日のイベントで使う発表資料の手直しをした。たぶんいい感じ!マウスのホイールがキュッキュと鳴いている。 普段睡眠が足りなすぎて保留になっていたアップデートパッチがこのダウン期間で一気に当たった感じがする— daiiz (@daizplus) 2025年4月9日 セブンイレブンのラーメンサラダ ラーメンサラダのメンサの部分 Google AI StudioでGemini 2.5 ProにRAGの説明用の図を描いてもらった。一発でこれを出せるのすごいと思う。SVGで出力しているので編集も簡単。 RAG(Retr…
ハンバーガーの包装紙にEthernetアダプターが繋がれているユーモラスな画像。木目のテーブルの上に置かれている。
花粉症をこじらせてダウンしております。お粥を食べます。— daiiz (@daizplus) 2025年4月7日 たまご雑炊美味しい。ケンタッキーのフライドチキン食べたい。回復しつつある。
画像ページにおいて、関連画像リストに関する思考チャートも生成できるようになった。下図の例のように、論文の1ページ目でこの機能を実行することで、論文全体を通して重要な知識の概要を構造化できる。関連画像欄にはこの論文の他のページに加えて、別途収録したコンテンツがサジェストされており、これらを有効活用できる。 Related imagesに基づくフローチャート Claude Codeによるアピールタイム 今回のメイン実装担当者であるClaude Code氏のコメントです。 「Ask the Flow」の新オプション「Related images」で複数の関連画像の知識を一度にグラフ化 画像間の共通テ…
一日中寝ていた。そしてまた寝る。おやすみ世界。
Phonnoの開発でClaude Codeを使い始めた。Dockerコンテナ内で動かせるので安心安全。明日からたくさん働いてもらうぞー! Claude Code 起動成功 力試しとして、昨日の記事で紹介した機能の実装をソースコードから探して説明してもらった。だいたい合っている気がする。Box Descriptionと命名してしまったけれどClaudeが書いているBox Overviewのほうがいいな。 daiiz.hatenablog.com # Claude日記: Box Overview Generation機能の調査 ## 2025-04-04 ### 機能概要 - ブログ記事「http…
Boxに収録されている画像ソースをざっくり理解して、概要を生成できるようになった。画像を新たにアップロードしたときや、雑多なテーマを扱っていて様々な切り口から書けそうなときは適当なタイミングで再生成される。 概要を書くためにLLMが一度に読めるコンテンツ量には限りがあるので、でかいデータセットの場合はランダムに選択している。無作為に選ばれた画像郡から新しい概要を作り、既存の概要とミックスする。この二段構えにすることで、過去の生成結果も適度に取り込みつつ新鮮さも得られていい感じだった。ランダム凝縮と名付けた。GraphRAGのコミュニティ要約のアプローチも気になるので時間をみつけて実験してみたい…
良いニュースと悪いニュースがある。 悪いニュース 行きつけのすき家が閉まっていてモーニングを食べられない Kyashに残高を回収されていた Kyashに500円ほど吸い込まれた模様— daiiz (@daizplus) 2025年4月2日 Kyashのアカウントは閉鎖されていて直接は確認できていない。連携していたマネーフォワードでわかった。もうそこにはない星を時差で見る天体観測のようだ。星が崩壊したあとに発生した粒子を観測できるかもしれないからもう少し見ておこう。 個人開発のGCPの先月の請求が3000円も増加した Artifact Registryの利用料(オレンジ色)だった daiiz.h…
今日の日付画像での、年度初め恒例の桜イラスト。このデザインももう5年目だ。来年は差し替えようかな。2025年度も頑張りましょう!
今月は安定してコードを書けた。 お疲れさまでした! 千疋屋 苺のムース
京都に帰ってきた。 新横浜駅にて。 京都駅にて。八条東口から出たほうが地下鉄への乗り換えは便利なのだけど、雰囲気が明るいこっち側を使いがち。 日常の何気ない瞬間を積極的に写真に残していきたい。
南町田グランベリーパーク
来月上旬の Helpfeel Tech Conf 2025 での登壇に向けて散髪してきた。髪型がより自然な雰囲気になるために2週間のバッファを設けている。そろそろ発表資料を書かないと! 発表資料を書いていこう! https://t.co/78cMqj6Rfv— daiiz (@daizplus) 2025年3月28日 帰りにベローチェでドライカレーを食べた。 本日の京都タワー。標準カラーでのライトアップの姿。 昨晩はAIと会話して夜更かししてしまったので今日は早く寝たい。
Claude DesktopでModel Context Protocol (MCP) サーバーを接続し、ローカルファイルを操作できるようになった。自分の関心領域としてMCPの世界にどれだけ深入りするかはまだ分からないものの、漠然と苦手意識を持ちたくない、かつ、議論にはついていきたいので人並みに触っていきたい。思いがけないアイデアを閃く可能性にも期待している。今日のところは @modelcontextprotocol/server-filesystem を使ってチャットログを書き出したり、超小規模なRAGみたいなことができた。次はこれの実装を読んでオリジナルなサーバーを書きたい。 タスクバーに…
Duolingoで数学(まだ算数レベル)をやっている。50日続いた。四則演算の表現方法がなんか独特な世界観で面白い。ブロックを5, 10区切りで数える癖をつけさせようとしている感じがする。例えば正解が「27」になる問題では、でかい塊が2つあって半端なブロックが2個転がっているやつを選べばいい。視覚的に即答できるようになってくる。 答えをズバリ数字として入力するだけでなく、数直線上でスライダーを動かして答える問題も多い。おかげで四分の一の場所をピンポイントで選ぶのがうまくなった。 このゆるい世界観でどこまで難しい問題に挑めるのか、不安を抱きつつも続けてみる。いまのところは文章題の英語の理解の方が…
実世界で見聞きしたもの、食べたもの、体験したこと、考えたことを全部LLMのコンテキストに載せたい。人生を記述して、対話を可能にし、自律的に新しい作品を生み出すための技術を探究していこう。プロジェクト life.txt、ここに始動。 Long ≪ Life context
カレー、タイ米、月曜日
PDF画像のページ送りに対応した。Phonnoでは、PDFファイルがアップロードされたとき、各ページを画像に分割して保存している。この際にページ画像の順序を保持しているため、前後のページに移動できる。データ構造的には独自のドキュメントビューワを作るための下準備が整っている。あとは時間をみつけてイケているUIを書いていきたい。 気の向くままに検索してもっともらしい画像に着地したのち、周辺ページを読み進めて前提知識や関連情報を獲得できる。 移動時のガタツキもなるべく早くなんとかします。
急に暑くなった! 22度!?— daiiz (@daizplus) 2025年3月22日 洗濯が捗ったのはよかったけれど、とにかく目が痒い!!
NotebookLMにマインドマップ機能が追加されていた。 Phonnoで研究開発中の思考フローチャート生成も負けていられないな! daiiz.hatenablog.com グーグルに先駆けて似たものを出せていたのは先見の明がある感じがしてなんか嬉しい。
まだまだ寒い。花粉症で頭の回転が悪いなりにコードを書きまくった一日だった。焼きそばを食べて寝よう。
Geminiに改行爆弾を送り込まれることがあって困っている。 結構な頻度でGeminiに改行爆弾を送り込まれることがあって困っている pic.twitter.com/8vy1IiwpqU— daiiz (@daizplus) 2025年3月19日 pic.twitter.com/dJNtxCJD4n— daiiz (@daizplus) 2025年3月11日 こちらは-1爆弾。 pic.twitter.com/bEQq5YhMKM— daiiz (@daizplus) 2025年2月26日 出力トークン長をめいっぱい使って送ってくるので待ち時間も長くなる。この文字列が課金されるのも気に食わない…
自宅のWi-Fiルーターが壊れてしまった。本日は有線接続でお送りします。 持っててよかったEthernet to USB-C変換ケーブル。
個人開発で運用している複数のGCPプロジェクトで警告が出ていた。いよいよ期限が迫っているので着手。ドキュメントを読みつつ提示されたコマンドを実行するだけで無事に移行できた。新たな環境での権限付与のレビューだけ大変だった。Container Registryに保存されていたDocker imageが全部コピーされて時間がかかった。もはや参照されていない古いやつは予め消しておけばよかった。2022年の懐かしいimageも出てきた。 対応完了した。「今日の日付」画像、点描画変換ツール、miilClient、Phonno、Chronicle、Snapshot machineなどがすべて救われた。めでた…
午前中は開発の議論をして、午後は鎌倉でフレンチイタリアンをいただいた。 小学校の遠足ぶりの小町通り ブイヤベース、牡蠣、セロリの新芽 サーモン、バジル、マンゴーソース。クラスタリングの可視化を思い出した。 daiiz.hatenablog.com daiiz.hatenablog.com 鯖、マンゴー、カリフラワーソース モチモチ食感のパスタ、猪肉のラグー。猪肉のRAG。この料理と一緒に出されたワインが好きだった。写真を撮り忘れた。 めっちゃ美味しい豚肉 2種類のチョコレート
夕方まで爆睡したあと、藤沢で id:kanata_02くんとディナーしてきた。技術書典18に無事当選できたので出展の作戦会議をはじめた。TeamJとしての初の現地参戦*1を最大限に楽しめるよう、なんとしても新刊を書きたい。執筆スケジュールを綿密に組もう。他にも万博やWWDC、Mac miniの話もできてよかった。 写真を正方形で撮る(あとから切り抜くするのではなく最初から正方形で保存する)話を聞いて、試してみた。普段と構図の決め方が変わってきて難しい。まったく関係ないのに無意識にスマホの向きを変えたりしていた。言われてみればたしかにmiilやInstagramに投稿することを考えると長方形で撮…
今週末は藤沢〜鎌倉エリアに滞在予定。慶應義塾湘南藤沢キャンパスで開催された増井先生の最終講義に出席してきた。 京都に帰ったら改めてレポートを書きたい。 聴講者による最終講義の実況: https://x.com/hashtag/masui_last_lecture?src=hashtag_click
3ヶ月ぶりにGeminiに感動した。前回の感動はこちら: daiiz.hatenablog.com 今回もGoogle AI Studioでのできごと。アップロードした画像をテキストで編集できるようになった。加工したい内容をプロンプトで指示するだけで画像を生成してくれる。指示と関係ない箇所はほとんど変更されない。これがすごい。 Google AI StudioでのImage Editingのデモ。クロワッサンにチョコソースをかけるよう指示している。 ここまで綺麗に画像の大部分を維持して望み通りの編集をしてくれるツールは初めて見た。素人ユーザーとしてはPhotoshopでも難しかったと思う。 ほ…
マクドナルドのハッピーセットで、チキンナゲットのおもちゃをゲットした。 ハッピーセットのチキンナゲットのおもちゃゲットした pic.twitter.com/iT2Jx2KnOI— daiiz (@daizplus) 2025年3月12日 自作のナゲット形状分類器にもかけてみる。全体的に丸みが強いせいで判別に苦戦していた。これまでの実験では、本物のナゲットに対しては、RGBフルカラー写真で学習したモデルで最もよい結果が得られる傾向があった。しかし今回のおもちゃを対象にしたときは、輪郭線画像データで学習したモデルが安定していた。また、いずれのケースにおいても二値化画像(白黒画像)のモデルはほとんど…
PDF文書の入力に対応しました。ファイルを選択するだけで、全ページが自動で画像化されてPhonnoに取り込まれます。 つぎは、対象の題材をとことん読んで理解するための支援機能を作りたい。せっかくLLMという最強の武器を手に入れたのだから、概要を雰囲気で把握するのではなくて、完全に納得できるまで寄り添ってくれる文書・画像ビューワを目指したいところです。超検索型ドキュメントビューワ。
マクドナルド、モスバーガー、ケンタッキーをだいたい攻略したので、次はロッテリアに進出していきたい。ハニーマスタード チキンフィレバーガーを食べた。美味しい。フライドポテトも好みのタイプでいい感じだった。 撮影: Pixel 6a、加工: Foodie
春の服を見てきた。とは言ってもまだ急に寒くなったりするので油断はできない。冬のコートをクリーニングに出すのももう少し待ったほうがいいかもしれない。 花粉症のせいでものすごく眠くて、思考力がGPT-3.5 Turboくらいになっている。体調が万全でないときは深く考えないほうがいい。これまでの経験でようやくわかってきたけれど、ここでなんとか力を振り絞って複雑なことをやったとしても、後からほとんどやり直す羽目になる。さほど頭を使わなくても淡々とこなせることだけをやって、あとは寝ておくに限る。 こんな状況でもWhiskは楽しめる。 daiiz.hatenablog.com https://x.com/…
検索画面の画像リストのSkeleton loadingを実装した。これまでは画像リストの初期高さが0pxであったため、画像の読み込み完了前後でガタツキ(レイアウトシフト)が大きかった。全体的にだいぶ良くなった。あとは説明文とキーワードサジェスト領域も同じように対応できたら完璧だ。 Chrome Dev Toolsで Slow 4G 回線をシミュレーションした様子。 おまけ 個人開発のGitHubリポジトリにGemini Code Assistをインストールおり、AIにコードレビューに参戦してもらっている。自動生成されるPull Requestのサマリーで英語を勉強できる。今日は jarring…
外出時に持ち歩いているメモ帳。コンビニで売っているやつ。ふと思いついたアイデアを書き留める。大事なページはコピーして自宅のフォルダで保管する。見開きでコピーするとき、B5紙面に収まるように拡大するには 123% (ほぼA5 -> B5) を指定すればいい。語呂が良くて覚えやすい。コピーを終えたらページをミシン目で切り取って破棄する。街中で落としても安心! www.kokuyo-st.co.jp カットオフノート5号(A6)中横罫48枚 ● 必要なページだけをきれいに切り離せる、ミシン目入りのカットオフタイプ。 ● 特殊フィルムでラミネート加工したクロスを採用。背が破れにくいだけでなく、ボールペ…
京都駅のカフェでパンケーキを食べた。 AIがコードを書いてくれるようになったら、パンケーキとハンバーガーを巡る旅をしたい。
Phonno: キーワードの概要パネルにも思考チャートを表示する
表題の通り、キーワードの解説が生成されるパネルに、関連用語や関連概念を示すフローチャートが表示されるようになりました。Ask the Flow機能の発展形です。現状ではリアルタイムで生成するため少々時間がかかりますが、生成結果の保存と再利用の仕組みを(AIが)実装中なのでそのうち爆速になります。 Bigtableに関する知識整理の例 daiiz WikiでのChatGPTに関する説明の例(デモ) その他のアップデート 画像配信: 大量のサムネイル画像が読み込まれる検索画面が安定しました。初期描画完了までの時間が短縮されます。Cloudflare R2オブジェクトのPresigned URLを作…
大学時代からの友人が久しぶりに京都に来たので飲んできた。僕が大学院を中退して地元から引っ越したりといろいろあったけれど、知り合って12年経ったいまでも、こうして定期的に会って盛り上がれるのは本当にありがたい。 daiiz.hatenablog.com
花粉症で目が痒くて文字を読むのがしんどい。Deep Researchの長文レポートをポスター形式でまとめて一撃で概要を把握したい。ウェブUIから o3-mini-high、Claude 3.7 Sonnet、Gemini 2.0 Flash Thinking を試してみた。自分でロジックを組む前に、何事もまずはAIの実力に任せてみて課題を探るのがいい。ということで情報の取捨選択からレイアウトまでやってもらう。プロンプトを調整すればもっといいものが出るだろうが、今後の開発戦略を考えるためのベースラインということで。 入力内容 Deep Researchの結果(Markdown形式のテキスト) プ…
トンカツを食べようと思って出掛けたが、お店を間違えて海鮮丼になった。
Phonnoでの思考フロー生成(Ask the Flow)機能が誰でも使えるようになりました🎉 検索画面と画像プレビュー画面でフローチャートを生成できます。 API料金の都合でこれまではログインしているユーザーのみに開放していましたが、今日からはログイン状況に関わらず利用できます。ボックスの編集者だけでなく、検索専用ビューの利用者にも触ってもらえるので嬉しいです! GPT-4o, o3-mini, Claude 3.5 Sonnet と試してきましたが、精度はそこそこ満足できても料金や速度面で課題が残っていました。先日 Gemini 2.0 Flash が一般提供開始されたことで選択肢が増え、…
生活圏内なのに7年間も気付けなかった飲み屋でご飯を食べてきた。どれも美味しい!今度時間があるときに他の料理やお酒も冒険したい。 なんと2月が終わってしまいました。今月も読んでくださりありがとうございました。来月はもっと充実したコンテンツをお届けできるよう頑張ります💪 PhonnoのPDFファイル対応間に合わなかった...!
今週のお題「本屋さん」 物心ついてから大学時代までお世話になった、地元神奈川の有隣堂を応援している。YouTubeチャンネル『有隣堂しか知らない世界』がおもしろい。ブッコローというミミズクのキャラクターのMC力がすごい。動画に出てくる書店員さんたちの個性が光りまくっている。 ここ最近、関西にも進出しつつあって嬉しい。このあいだはお洒落な神戸店に行ってきた。 熱心なファンなのでグッズも買っている。ブッコローのLaQを組み立てたり、イメージカラーの橙羽色(とわいろ)の限定インクを買ってみたり。 オフィスにぬいぐるみも住まわせている。退社時間になると心做しか疲れているようにも見える。 YouTube…
PhonnoでAnthropicの最新モデルClaude 3.7 Sonnetを選択できるようになりました。 3.5 -> 3.7 にバージョンアップした いつもの「daiiz Wiki」のデモも更新しておきました。 https://phonno.org/_d7ad2f536ace4d21ae9f8fb833194482 実際にRAGを試してみると、前のモデルよりも出力文章が長くなる傾向が見られた。この現象を良いように捉えて、些細な情報も最大限に拾って回答構築されるようになったと考えてもよい。しかし逆に冗長で歯切れが悪くなったとも言える。 生成結果は読み物としては面白いのでしばらくは静観しつつ…
麻婆豆腐か麻婆茄子を食べたい! 麻婆〇〇をいろいろ冒険したい。 今日のランチはAIセレクトでシャカシャカチキンを食べた。マクドナルドで辛いメニューを満喫するデッキを作ってもらった。Red Pepperの粉が辛さの要素だった。 Shaka Shaka Chicken🍗
いちご 桜 ソイ ラテ
OpenAI OperatorにSVG Drawingsを使ってイラストを描いてもらった。SVG Drawingsは僕が自作しているお絵かきツールです。初めてのAIユーザーを獲得した記念すべき瞬間です。 Zigzag Harmony このイラストには「Zigzag Harmony」という題名を提案します。ジグザグのパターンと線が調和している様子を表現しています。いかがでしょうか? by OpenAI o1 SVG Drawingsでは書いた順番も保存されている。今回の絵はこんな感じ: 最初から再生 document.querySelector("#zzzbtn").addEventListen…
新作20250213の派生として開発が進んでいる。できたてのプロジェクトに名前をつけると固定観念が生じてしまうため、ある程度の方向性が見えるまでは日付で呼んでいる。 scrapbox.io 最初のデモがデプロイされてフィードバックも貰い始めた。ついにコードネームも割り当てた。この三連休は優先度が高い実験を進めている。 日付は引き続きバージョン番号として使われる。 食事 ガパオライス+目玉焼きトッピング
友人のid:kanata_02くんとやっているポッドキャスト「TeamJ.fm」の第2回を公開しました。技書博11参加のために宿泊した横浜のホテルで収録した回です。普段CosenseやTwitterでは技術ネタをメインで発信しているので、ブログとラジオでは日常生活にフォーカスしていきたい。 チェックアウトまでの空き時間で素早く録音できてすごかった。kanataくんが良さげな機材を持ってきてくれるので毎回楽しみ。ピンマイクをつけると話すぞという気持ちになってくる。 横浜滞在期間中の日記も貼っておきます。もう懐かしい。 daiiz.hatenablog.com daiiz.hatenablog.c…
同僚とランチ。親子丼美味しい。 コンビニで試験販売していた飴。本当に味がなかった。 読書。だいぶ前に少しだけ読んだことがあったけれど、今のほうが圧倒的に解像度高く理解できる。めっちゃ面白い。 そして、12日ぶりにまた暖房が効かなくなった。凍えて寝る。 daiiz.hatenablog.com
LLM時代のソフトウェア開発の戦い方が分かってきた。 戦い方が分かってきた。来月にはまたわからなくなっていそうだけども。— daiiz (@daizplus) 2025年2月19日 Google製の楽しい生成AIサービス「Whisk」を見つけた。複数の画像やテキストを組み合わせて新しいテイストの絵を生成できる。Vertex AIでImagen 3のAPIも開放されたので画像生成系の遊び方を再び模索したい。 blog.google かわいい世界観のケンタッキーのツイスター このWhiskだけでなく、Google AI Studio、ImageFX、NotebookLMなどなど、最近のGoogle…
「ブログリーダー」を活用して、daiizさんをフォローしませんか?
びっっくりするくらい眠い アイスコーヒーでも勝てない 残念!!!
技術書典18の商品ページを書きました。6月1日、池袋・サンシャインシティ 展示ホールD(文化会館ビル2F)、せ-02 TeamJ でお待ちしています! 新刊🎁 techbookfest.org 検索ネタの既刊📚️ 技術書典のストアでは新刊扱いになっていますが、初出は過去の技術書博覧会です。 techbookfest.org techbookfest.org 画像ネタの既刊📖 techbookfest.org techbookfest.org
京都に帰ってきた。 京都駅のスタバで技術書典のストアに原稿をアップロードした。
EXPO 2025 大阪・関西万博に行ってきた。一回目。id:kanata_02と一緒にまわった。取り急ぎ思い出の写真たちを。ネタバレにならない(すでにインターネットに出回っていそうな)範囲で。特にコモンズ館の各国の展示品はどれも魅力的で気に入ったものがたくさんあったけれど、初見で実物を見たほうが良いと思うので、いまは敢えて詳しく書かないでおく。スマホやパソコンの壁紙にして日常で触れていきたい。 シグネチャーパビリオン null2。抽選に落ちたので中には入れていない。建物の外観は昼も夜もかっこいい。唸っていて可愛い。ちなみにkanataくんは当選していたのでレポートを期待している! 大屋根リン…
大阪城を眺めています。 海老と蛸とガーリックトーストが美味しかった。 海老 リターンズ 京阪プレミアムカー 原稿、整いました。明日入稿します。
頑張っています。明日未明には仕上げたいところ...! 生成AIによるミャクミャク様バリアント(サーカス隊ふう)
東京駅でハッピーターンのイベント展示やっていた。 このクッションほしい。 京都に帰ってきた。
技術書典18の新刊の表紙は、クリーム色です。
6月の技術書典で頒布する新刊『LLM時代の検索を考える観察日記 2』を書ききった。原稿が終盤に差し掛かると、ページ数を4の整数倍に合わせる微調整に苦労する。ここから原稿チェックと修正の作業に入ります。誤字脱字や不適切な表現の検査はAIの力も借りれそうなので、前回よりもスムーズに進むと思う。オンラインストアとお品書きも準備しないと! いくつか収録を諦めた項目もあるけれど、いまのうちに書いておきたいことはだいたい入れられたのでよかった。昨夜から今日にかけてGoogle I/Oが行われているので、また大きく歴史が進む。おそらくMicrosoftやOpenAIからも追従してビッグニュースが出てくるだろ…
今日も頑張って生活しました。 存在しているだけで精一杯な日ってあるよね。 超低速でコードを書いたり本を書いたりした。 今日配信が始まったNotebookLMのスマホアプリをインストールしてみた。音声概要の再生プレイヤーみたいなUIになっていた。 すき家のナポリタン牛丼、美味しかった。 マクドナルドのベーコンポテトパイが販売期間終了っぽい雰囲気で悲しい。
クロワッサン鯛焼き さつまいもあん
お好み村 — お好み焼き屋がひしめき合うビル。生誕60周年! 昼はお好み焼きと牡蠣のバター焼きを食べた。 お好み焼きのワークフローを観察していた。 広島を満喫して帰ってきた。駅弁屋で穴子飯を買ったものの食べる間もなくあっという間についた。帰りはのぞみ号に乗れた。行きは間違えてひかり号に乗ってしまったけど、それでも体感時間は全く長く感じなかった。ひかりで大体2時間くらいで、これは普段よく使う京都-新横浜間ののぞみでの移動に相当する時間だ。西方向にも積極的に移動していきたい。 広島駅 駅弁は夕飯にした。穴子飯は人生初かも? 名古屋のひつまぶしも相当美味しかったけれど、こっちのほうがあっさりしていて…
こんばんは 本日の進捗 日記 広島に来ている。蒸し牡蠣。ポン酢とタバスコの組み合わせが旨かった。 蒸し牡蠣
こんばんはこんばんは 本日の進捗 印刷方式都合の最小構成20ページを超えられたので、なんとか本にはなれそうですね! 日記 Google DeepMindのAlphaEvolveに仰天した。これまでもAlphaGo、AlphaFold、AlphaTensorの成果を眺めては驚いてきたけど、AlphaEvolveは群を抜いてヤバそう。Alphaシリーズの問題設定が毎回うまくて感動する。 deepmind.google Alphabetという会社名、もしかして、Alphaシリーズの研究にbetするという意味を含んでいたりしない?
こんばんは 本日の進捗 睡眠失敗中なので書いていく。 日記 昨日から書いていた機能が仕上がってよかった。マクドナルドのベーコンポテトパイのパッケージが変わっていた。たまたま?
睡眠失敗が続いていて眠い!! 本日の進捗 なし。残念! 日記 めっちゃコードを書いて、事務作業もした。技術書典のオフライン会場でのサークル番号を把握。完全手ぶらセットも申し込んでみた。テーブルクロスや値札などのブース設営グッズをいただけるらしい。楽しみ。
首を寝違えてしまって左を向けない。真っ直ぐ前を向いて原稿を書けということだろう。 本日の進捗 まだタイトルだけのセクションもありますが、おおむね順調に進んでいます。 単純比較で前日比 +8 ページ。 日記 季節限定メニューの冷やしラーメンが始まって嬉しい。待ってました! 毎日通いたいくらい嬉しい。 優勝
今日から一週間は、執筆の進捗を共有する日記になります。前回の続編『LLM時代の検索を考える観察日記 Ⅱ』を書いていきます。(前作は下記のBoothショップで買うこともできますよ!) daiiz.booth.pm 差分を振り返っていたらBardがGeminiになっていたりと、2年弱の間に世の中が大きく動いてきたことを痛感する。収録したいことはたくさんあるけれど、着手も筆も遅いので厳選しないといけない。辞書の編纂委員になったみたいで楽しい。 Bard 懐かしい 文章のリズムを思い出すためにファミレスで読み直していた。やっぱりこの表紙の紙質は予備校時代を思い出せる。勉強熱心だった頃の自分を降ろしてき…
背景 Gemini FlashのObject detectionやOCRの性能が向上したという噂を聞いたり、実際にGoogle AI Studioで遊んだりして可能性を感じていた。写真を入力として「犬・猫」や「ガラス製品」など検出対象が明確なタスクでは概ねうまく動く手応えがあった。今回はスクリーンショットに対して「画像の代表領域」「最も重要な領域」「価値の高い情報を提供する箇所」のような漠然としたクエリでの切り抜きができるかを検証したい。 daiiz.hatenablog.com Crop with AI機能 画像内の重要な領域を特定してアノテーション作成を補助するPhonnoの機能。これまで…
いろいろ食べているうちに、商品の英語名称を読むほうがシンプルということに気付いた。推したいことをピンポイントで伝えている。それと同時に結構な情報が失われていることも見えてきた。 どかっとテリマヨチキンパン → Teriyaki Chicken これは情報量はほぼ同じ。マヨネーズ要素が欠落してしまって勿体ないが。 手巻きソーセージドーナツ → Sausage ドーナツであることを諦めたなと思ったが、たしかによく考えるとこれ一般的にはドーナツとは言わないないのかも。 ツイストサンドマーガリン → Margarine 特に気になることはない。美味しい。 バタークロワッサンメロンパン → Butter…
こういう時代なので作りたいものや試したいアイデアは山ほどあるのだけど、いまいちモチベーションが高まらない。自分に何を求められているのかも見失いつつある。もっと盛り上げていきたいけれど、実は方向性を間違えているのかもしれない。いまはひたすらに頑張って向き合って、刺激を取り戻したい。
自分が何を考えていて何がしたいのかよく分からなくなってきたので、何かが好転するかもしれないという希望を託してブログを再開します。かなりの長期間休眠していたけれど読者が減っていなくて(むしろ増えている気もする)みんな優しい。今後ともよろしくお願いします。