chevron_left

メインカテゴリーを選択しなおす

cancel
arrow_drop_down
  • Perplexity Pro しばらく引退

    ソフトバンク回線利用特典の1年間の無料期間が終了したのでProプランから引退した。Perplexityは検索体験を徹底的に研究しているAIプロダクトとして、登場当初はかなり期待していた。Google検索の代わりに積極的に使ってみたり、ブックマークや記事の共有機能も試していた。 Proマークが消えた様子 しかし、ChatGPTやGeminiなどの大手汎用AIがウェブ検索機能を充実させてきたり、GoogleにSGE (AI Overview) が搭載されたここ最近は、残念ながらほとんど起動しなくなってしまった。いま振り返ると、ChatGPTとほぼ同時期にリリースされたDeep Researchの精…

  • 水曜日

    暑すぎる 空を使った扇風機 - ChatGPT¹, daiiz² ¹ OpenAI, ² TeamJ

  • 火曜日

    ここ2, 3ヶ月くらい、生活に必要な体力のすべてを非常用バッテリーで賄っている感じがする。非常用の低エネルギーでもこここまで動けていて、それなりの生産性を維持できているのはすごいことだ。あとどれくらい持つのだろうか。 ✅️ ヤマト運輸の営業所に技術書典あての本を持ち込んだ ✅️ コードを書いた ✅️ コードをレビューした ✅️ 新しく見つけたお店でカレーを食べた イエローカレー

  • 月曜日

    週の初めはパフォーマンスがよくない。 ✅️ 起きる ✅️ 発送指示書を印刷する ✅️ 発払い伝票を書く ✅️ コードを書く

  • 日曜日

    この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛くなかった、残念。チキンサラダが美味しかった。食後に眠気が襲ってこなかったのでサラダ生活を始めようか。 技術書典18、無…

  • 土曜日

    ChatGPT o3(ウェブアプリ)で写真から文字の領域を切り出して文字画像を作る実験。さて、オリジナルの写真は何でしょうか!? 日常風景から文字を集めるアプリを作りたい。

  • 金曜日

    今週もお疲れ様でした!! 缶ビールをカシュッと開けたらClaudeのロゴのアメーバみたいな飛沫(しぶき)ができた記念。 Claude Max プランを契約しようかと迷っている今日このごろ 芸が細かい。

  • Phonno: 写真に対するCrop with AI機能の改善

    PhonnoのCrop with AI機能の精度を改善した。この機能では、ボタンを押すだけで画像から得られる知識として重要な箇所を特定できる。実装としては、以下の記事のように、従来のCloud Vision APIをやめてGeminiを使うよう舵を切っていた。 daiiz.hatenablog.com 今回はGeminiに渡す際のプロンプトの調整を行った。その結果、特に写真に対する切り抜き領域の特定が安定した。熱海旅行での写真を例にいくつか紹介してみる。 ボトルを中心にして程よいサイズの矩形を作れている。文字の読み取り精度と画像の説明も悪くない。 注目したいオブジェの位置を正確に捉えている。文…

  • Okonomi: PNG/JPEG画像の入力に対応

    知的生産活動支援 AI Agent「Okonomi」の開発を続けている。 daiiz.hatenablog.com PNG画像に対応したことで、PCやスマホのスクリーンショットをネイティブに理解できるようになった。フォルダに突っ込んでおくだけでよしなに情報抽出できる。これの動作の様子は別の機会にまとめる。 JPEG画像に対応したことで、実世界の写真を読み解けるようになった。インデクシング工程でGeminiで画像を解析し、得られた視覚的な情報をOkonomiの独自のテキストフォーマットで文字として記録しておく。推論時にはこのテキストメモと画像バイナリを両方入力として使う。Geminiはマルチモー…

  • 帰京

    京都に帰ってきた。明日からは開発に戻っていく。ここから先の仕事との向き合い方を改めて考えていきたい。この大AI時代に、キャリア8年目として、何をするべきなのか。 ホテル 今回の熱海旅行で泊まっていたホテル。波の音が心地よくてとても良いところでした。二泊くらいあるとバーとか温泉とかを余裕を持って堪能できると思う。Instagramをフォローしてステッカーをもらった。 ロビーとステッカー 帰りの送迎バス 記念のボールペンを買った。ほどよい重みがあっていい感じ。 JR熱海駅 散策 www.atami-yogurt.com 熱海ヨーグルト発酵所の「のめるヨーグルト」。たまたまお洒落な店を見つけて買って…

  • 熱海旅行 WWDC鑑賞

    熱海のホテルでWWDC25の鑑賞会をしている。 kanataくんのプロジェクタで壁に投影している 名前がわかりやすくなった macOS Tahoe 期待。Spotlightからクリップボードの履歴にアクセスできるようになるだけですでに嬉しい。 お疲れ様でした 直後の感想 新デザイン「Liquid Glass」も全体的にはよさそう。ただ、Windows VistaのAeroみは感じる。

  • 熱海旅行

    熱海に来ている。 JR熱海駅 小雨が降っていて思ったより寒かった。運のいいひかり号に乗れたらしく、京都から熱海まで乗り換え無しで来れた。 熱海駅開業100周年とのこと。おめでとうございます。 昼に食べた鯖の味噌煮定食 終盤に小骨に舌を攻撃されたけど、口内細胞の修復スピードだけは信頼しているので問題ない。 手作り海鮮丼。 あら汁に白身魚の刺身を入れたら美味しかった。エビストローネ(海老の刺身+ミネストローネ)もいい感じだった。 懐かしい バブル時代の面影を感じる バブル期の建造物が大好きです。 daiiz.hatenablog.com

  • Okonomi - 知的生産活動支援 AI Agent の試作

    知的生産活動を支援するAIエージェント「Okonomi」を作っている。 広島でお好み焼きのワークフローを眺めていたときに思いついた、Claude Code + NotebookLM + 曖昧記憶グラフ を組み合わせたツールの骨格ができてきた— daiiz@技術書典18 せ02 (@daizplus) 2025年5月30日 この土日での進捗を紹介します。複数のPDFファイルを読み込んで論理的な目次を生成し、質問応答ができるようになった。さらに実験的な機能として、対話のAutopilotモードも実装した。言語モデルはGemini 2.5 Flashを使っている。難しいタスクは部分的にProやCla…

  • 土曜日

    個人開発でGemini縛りでAI Agentを作っている。API利用料金が高くなってきた。Thinking Text Outputが半分以上を占めている模様。 共著者の多いプルリクエスト

  • 覚悟

    本日のClaude Codeとの会話の一コマ

  • 木曜日

    がっつり中華料理を食べて爆睡した。 眠気が襲ってこない食事を心がけたい。食後の時間も有効活用したい。 ゆっくり食べればいいのかな。 技術書典18で開催中のオンラインマーケットで新刊・既刊ともにぽつぽつと売れ続けている📚 ありがとうございます! 購入時にXに投稿していただけたら、いいねとリポストしにいきます。 京都も夏を感じるようになってきた。 夏バテ対策も頑張りましょう!!

  • フローチャートを育てる

    プロンプトの改良を続け、モデルの進化の恩恵を受けた結果、Phonnoで生成されるフローチャートが安定してきた。リリース当初と比べて生成結果の文法エラーが減少し、さらに本質的な情報を捉える能力や表現力も向上している。画像知識からフローチャートを生成できるこの機能、Phonnoのキラーフィーチャーとして育てていけるかもしれない。 技術書典18に関する情報を構造化した様子 チャートのノードをクリックして検索できるようにしたら、これまた楽しい。ユーザーに検索クエリツリー(グラフ)を見せてあげている感じになる。リスト形式での単語のサジェストはよくあるけれど、この方式ではエッジで繋ぐことで単語の意味的な関…

  • 火曜日

    頭のなかで、開発作業を怠けていないかを見張られている。なんで手を動かしてないの〜って言われる。惰性であっても手を動かしていればなにか形になってきて、形が見えてくると今度は改良したくなる。こうやって生まれてくるなにかもある。

  • 月曜日

    ネムスギル! 技術書典で買った本をぼんやりと読むことしかできなかった。事務作業は進んだ。月曜日は縦になっただけでも偉いということで、どうか許してください! これは昨晩に食べたフォーです。

  • 帰京

    技術書典のオフライン参加を終えて、京都に帰ってきた。 新幹線ホームの自販機で作れるコーヒー。微糖にしてみた。 夜の京都駅は空いていた。急いで走っている人とゆったりしている人が半々くらい。 原稿の締切から無事に開放されたので、ここらしばらくは開発に力を入れていきます。

  • 寿司曜日

    有明に来ています。 銀座 量平寿司 江戸前鮨 よい機会があって銀座でお寿司を食べた。青柳(バカ貝)に感動した。想像を大きく超えてきた。初めてGPT-4を触ったときくらいに驚いた。握りはもちろん、なめろうの姿にも感動した。赤貝も美味しかった。貝ってこんなに美味しかったのか...!! とても貴重な体験だった。 これは赤貝。コース終了後に追加でにぎっていただいた。 うにも格段に旨い。 技術書典18 前夜 明日は技術書典18のオフライン会場開催の当日。池袋サンシャインシティ 展示ホールD(文化会館ビル2F)で新刊を売ります。技術書典のオフライン会場でブース構えるのは初めてなのでわくわくしています。id…

  • 金曜日

    書籍のサポートページを書いた。Pull Requestを作って待機中。明日、技術書典のオンラインストアがオープンしたらマージする。 前回の技書博で配布したフリーペーパーの電子版をまだ公開できていなかったので追加しました。お待たせいたしました。 https://books.daiiz.dev/

  • 木曜日

    びっっくりするくらい眠い アイスコーヒーでも勝てない 残念!!!

  • 販売スタンバイ #技術書典18

    技術書典18の商品ページを書きました。6月1日、池袋・サンシャインシティ 展示ホールD(文化会館ビル2F)、せ-02 TeamJ でお待ちしています! 新刊🎁 techbookfest.org 検索ネタの既刊📚️ 技術書典のストアでは新刊扱いになっていますが、初出は過去の技術書博覧会です。 techbookfest.org techbookfest.org 画像ネタの既刊📖 techbookfest.org techbookfest.org

  • 帰京

    京都に帰ってきた。 京都駅のスタバで技術書典のストアに原稿をアップロードした。

  • 大阪万博に行ってきた

    EXPO 2025 大阪・関西万博に行ってきた。一回目。id:kanata_02と一緒にまわった。取り急ぎ思い出の写真たちを。ネタバレにならない(すでにインターネットに出回っていそうな)範囲で。特にコモンズ館の各国の展示品はどれも魅力的で気に入ったものがたくさんあったけれど、初見で実物を見たほうが良いと思うので、いまは敢えて詳しく書かないでおく。スマホやパソコンの壁紙にして日常で触れていきたい。 シグネチャーパビリオン null2。抽選に落ちたので中には入れていない。建物の外観は昼も夜もかっこいい。唸っていて可愛い。ちなみにkanataくんは当選していたのでレポートを期待している! 大屋根リン…

  • 大阪城を眺めて海老を食べる

    大阪城を眺めています。 海老と蛸とガーリックトーストが美味しかった。 海老 リターンズ 京阪プレミアムカー 原稿、整いました。明日入稿します。

  • 原稿の修正作業中

    頑張っています。明日未明には仕上げたいところ...! 生成AIによるミャクミャク様バリアント(サーカス隊ふう)

  • 帰京

    東京駅でハッピーターンのイベント展示やっていた。 このクッションほしい。 京都に帰ってきた。

  • 表紙の色が確定しました

    技術書典18の新刊の表紙は、クリーム色です。

  • 技術書典18 執筆 7日目

    6月の技術書典で頒布する新刊『LLM時代の検索を考える観察日記 2』を書ききった。原稿が終盤に差し掛かると、ページ数を4の整数倍に合わせる微調整に苦労する。ここから原稿チェックと修正の作業に入ります。誤字脱字や不適切な表現の検査はAIの力も借りれそうなので、前回よりもスムーズに進むと思う。オンラインストアとお品書きも準備しないと! いくつか収録を諦めた項目もあるけれど、いまのうちに書いておきたいことはだいたい入れられたのでよかった。昨夜から今日にかけてGoogle I/Oが行われているので、また大きく歴史が進む。おそらくMicrosoftやOpenAIからも追従してビッグニュースが出てくるだろ…

  • 火曜日

    今日も頑張って生活しました。 存在しているだけで精一杯な日ってあるよね。 超低速でコードを書いたり本を書いたりした。 今日配信が始まったNotebookLMのスマホアプリをインストールしてみた。音声概要の再生プレイヤーみたいなUIになっていた。 すき家のナポリタン牛丼、美味しかった。 マクドナルドのベーコンポテトパイが販売期間終了っぽい雰囲気で悲しい。

  • 月曜日

    クロワッサン鯛焼き さつまいもあん

  • 帰京

    お好み村 — お好み焼き屋がひしめき合うビル。生誕60周年! 昼はお好み焼きと牡蠣のバター焼きを食べた。 お好み焼きのワークフローを観察していた。 広島を満喫して帰ってきた。駅弁屋で穴子飯を買ったものの食べる間もなくあっという間についた。帰りはのぞみ号に乗れた。行きは間違えてひかり号に乗ってしまったけど、それでも体感時間は全く長く感じなかった。ひかりで大体2時間くらいで、これは普段よく使う京都-新横浜間ののぞみでの移動に相当する時間だ。西方向にも積極的に移動していきたい。 広島駅 駅弁は夕飯にした。穴子飯は人生初かも? 名古屋のひつまぶしも相当美味しかったけれど、こっちのほうがあっさりしていて…

  • 技術書典18 執筆 6日目

    こんばんは 本日の進捗 日記 広島に来ている。蒸し牡蠣。ポン酢とタバスコの組み合わせが旨かった。 蒸し牡蠣

  • 技術書典18 執筆 5日目

    こんばんはこんばんは 本日の進捗 印刷方式都合の最小構成20ページを超えられたので、なんとか本にはなれそうですね! 日記 Google DeepMindのAlphaEvolveに仰天した。これまでもAlphaGo、AlphaFold、AlphaTensorの成果を眺めては驚いてきたけど、AlphaEvolveは群を抜いてヤバそう。Alphaシリーズの問題設定が毎回うまくて感動する。 deepmind.google Alphabetという会社名、もしかして、Alphaシリーズの研究にbetするという意味を含んでいたりしない?

  • 技術書典18 執筆 4日目

    こんばんは 本日の進捗 睡眠失敗中なので書いていく。 日記 昨日から書いていた機能が仕上がってよかった。マクドナルドのベーコンポテトパイのパッケージが変わっていた。たまたま?

  • 技術書典18 執筆 3日目

    睡眠失敗が続いていて眠い!! 本日の進捗 なし。残念! 日記 めっちゃコードを書いて、事務作業もした。技術書典のオフライン会場でのサークル番号を把握。完全手ぶらセットも申し込んでみた。テーブルクロスや値札などのブース設営グッズをいただけるらしい。楽しみ。

  • 技術書典18 執筆 2日目

    首を寝違えてしまって左を向けない。真っ直ぐ前を向いて原稿を書けということだろう。 本日の進捗 まだタイトルだけのセクションもありますが、おおむね順調に進んでいます。 単純比較で前日比 +8 ページ。 日記 季節限定メニューの冷やしラーメンが始まって嬉しい。待ってました! 毎日通いたいくらい嬉しい。 優勝

  • 技術書典18 執筆 1日目

    今日から一週間は、執筆の進捗を共有する日記になります。前回の続編『LLM時代の検索を考える観察日記 Ⅱ』を書いていきます。(前作は下記のBoothショップで買うこともできますよ!) daiiz.booth.pm 差分を振り返っていたらBardがGeminiになっていたりと、2年弱の間に世の中が大きく動いてきたことを痛感する。収録したいことはたくさんあるけれど、着手も筆も遅いので厳選しないといけない。辞書の編纂委員になったみたいで楽しい。 Bard 懐かしい 文章のリズムを思い出すためにファミレスで読み直していた。やっぱりこの表紙の紙質は予備校時代を思い出せる。勉強熱心だった頃の自分を降ろしてき…

  • Phonno: Crop with AI機能をCloud Vision APIからGemini 2.5 Flashに差し替えた

    背景 Gemini FlashのObject detectionやOCRの性能が向上したという噂を聞いたり、実際にGoogle AI Studioで遊んだりして可能性を感じていた。写真を入力として「犬・猫」や「ガラス製品」など検出対象が明確なタスクでは概ねうまく動く手応えがあった。今回はスクリーンショットに対して「画像の代表領域」「最も重要な領域」「価値の高い情報を提供する箇所」のような漠然としたクエリでの切り抜きができるかを検証したい。 daiiz.hatenablog.com Crop with AI機能 画像内の重要な領域を特定してアノテーション作成を補助するPhonnoの機能。これまで…

  • ファミマの菓子パンの観察

    いろいろ食べているうちに、商品の英語名称を読むほうがシンプルということに気付いた。推したいことをピンポイントで伝えている。それと同時に結構な情報が失われていることも見えてきた。 どかっとテリマヨチキンパン → Teriyaki Chicken これは情報量はほぼ同じ。マヨネーズ要素が欠落してしまって勿体ないが。 手巻きソーセージドーナツ → Sausage ドーナツであることを諦めたなと思ったが、たしかによく考えるとこれ一般的にはドーナツとは言わないないのかも。 ツイストサンドマーガリン → Margarine 特に気になることはない。美味しい。 バタークロワッサンメロンパン → Butter…

  • 出汁カレー

    久しぶりにオフィスの近くのCoCo壱番屋でランチ。期間限定メニューの炭火焼きチキンと和の出汁カレーを食べた。ふんだんに振りかけられた鰹節が踊っている。美味しんぼでもカレー対決で鰹節を削っているシーンがあった気がする。旨い。梅肉を添えたくなった。カレー自体がさっぱりしているので揚げ物をトッピングしてもいいかもしれない。 www.ichibanya.co.jp

  • 木曜日

    木曜日、もくもくとコードを書く日。まだ実験段階なので特に語れることはないけれど、新しい検索アルゴリズムを考えている。Phonnoやナッジグラフ構想で必要になってくると目論んでいるやつ。本質的ではないものの、あると実験が捗るパーツをClaude Codeがどんどん書いてくれるのでありがたい。実装の変更前後での検索結果を精査するためのレポーティング機能とか、CLIツールのオプションとか。ログ出力で表組みや絵文字を多用してテンションも上げてくれる。そもそも成功するかわからないプロトタイプの段階においては、多少作り方が荒くてもいいものは任せていけるといい。 Claude Codeは、調子が乗ってくると…

  • ナッジグラフ(造語)

    下記の記事で提案した、LLM 時代の知的生産行動をいい感じにデザインするフレームワーク「ナッジグラフ」はGoogle検索しても何もヒットしない。まだ誰も考え出していないようだ。 daiiz.hatenablog.com 氷の中の何かを釣っているイエティの画像(div要素のaria-label属性より) 取り急ぎCosenseでページだけ作って発信しておいた。言葉を造る実績を解除した。Coin a phrase. Neologism. ナッジグラフの生みの親になった(2025/5/7 13:26 撮影)

  • Phonno (Ask the Flow): `Unsupported markdown: list` の修正

    Phonnoの思考フローチャートで番号付きリストが解釈されなくなっていた。Unsupported markdown: listと表示されている。当該ノードは step1["1. すり鉢でごまを荒めにする"] のように、いたって普通に記述されている。 「食べ方の手順」が描画されることが期待される Mermaid-jsのv11系での問題のようだ。 Markdown lists are not supported · Issue #6099 · mermaid-js/mermaid · GitHub Markdown-by-default for labels complicates the upg…

  • 散歩

    烏丸五条 草間彌生 版画の世界、行きたい たぶん魔法界とマグルの世界を結ぶ扉

  • 帰京

    京都に帰ってきた。いい旅だった。ゴールデンウィークの後半戦はコードを書きます。頭が柔らかくなってアイデアの連想が止まらなくなっている。 Nudge Graph構想を進めていきたい。 ナッジグラフ(Nudge Graph)を設計・提唱したい。PhonnoやCosenseに蓄積された興味関心コンテンツと研究ノートを編み直し、LLM 時代の知的生産行動をいい感じにデザインできる気がする。— daiiz (@daizplus) 2025年5月4日

  • 福岡旅行

    茶碗蒸し本舗 稲穂 紀州梅、明太子 めかぶ味噌 愛知に続いて、櫻坂46 5th TOUR 2025 “Addiction”の福岡公演。 daiiz.hatenablog.com マリンメッセ福岡 A館 A館 バクテリオファージみたいなオブジェ お酒がまわると川を撮りたくなる ADDICTION

  • 金曜日

    新しいプロジェクトを始めた。最初からClaude Codeが参画している。まっさらな状態からコーディングを手伝ってもらった結果、$28も消費してしまった。 いろんなAIが寄って集って開発している。 お金はかかったけれど、数時間で超高速にたたき台が仕上がった。ここからは探究フェーズに入るので人間が頑張ることになる。明日は福岡。新幹線の中で進めよう。

  • 木曜日

    chrome://で始まるようなChrome内部URLの画面を読んでいた。システムページっぽさのあるブックマーク検索画面や印刷画面、証明書ビューワなどが意外とHTMLで書かれていた。CSSやJavaScriptの勉強になる。chrome://chrome-urls/ で内部URLのリストが見れる。 chrome://chrome-urls/ chrome://intro/やchrome://terms/など、一度見たら最後で普段は目にする機会がないページをいつでも見れる。chrome://dino/にアクセスするとオフラインにならなくても恐竜ゲームで遊べる。chrome://topics-in…

  • Phonno 開発日和

    有給休暇 1日目 Phonnoの開発が捗った。画像の視覚情報からグラフを構築する「Visual Meaning Graph」機能を試作して、ドッグフーディングを開始した。 Visual Meaning Graph #Phonno pic.twitter.com/LQ3p6302Cm— daiiz (@daizplus) 2025年4月30日 検索結果や画像ページで生成される思考チャートをMermaidのコードとしてエクスポートできるようになった。Cosenseにコードブロック記法で貼り付けやすくなった。 Phonno’s thought charts can now be exported a…

  • GPT-4とのお別れ

    GPT-4との別れの日が近づいてきたので手紙を贈った。 Farewell and thank you, GPT-4 🌸 送別会もしたい。 GPT-4の送別会しないと pic.twitter.com/2vIaymslKn— daiiz (@daizplus) 2025年4月17日

  • 帰京

    街灯に寄生した道路標識を見つけた。ミャクミャク様かもしれない。

  • 名古屋 2

    櫻坂46 5th TOUR 2025 “Addiction”の名古屋公演に友人と参戦してきた。細かい感想は千秋楽まで控えておくとして、超絶に最高だった!! ポートメッセなごや 終演後のステージ(写真加工済み) 終演後のステージ(写真加工済み) 規制退場の待ち時間にステージを撮らせてもらえる図らい、ありがたい。

  • 名古屋

    こぼれいくら丼 黒ビールレーズントーストレアチーズ 名古屋のイメージとあっているワンカット

  • 帰京

    東京駅 八重洲中央口 新幹線終電 着席成功 京都に帰ってきた。

  • 木曜日

    昨日に引き続き、本日のAIの無駄遣いを紹介します。ソースコードのタイポ TOOD -> TODO の提案をしてもらいました。ツイートにたくさんいいねが付いていて恥ずかしい。新幹線で揺られて書いたコードなのでこういうこともある!と言い訳しておく。 pic.twitter.com/Kw7C1Sa71D— daiiz (@daizplus) 2025年4月24日 中華食べた。美味しかった。 麻辣先生老四川麻婆豆腐、本場四川よだれ鶏、青山椒よだれ鶏

  • 水曜日

    最近のo3モデルの無駄遣いを紹介します。 正多面体 → 正多明太 → せいためんたいくん です。かわいいね。

  • 火曜日

    眠れない夜の散歩

  • 月曜日

    眠すぎる。眠いけどうまく寝れない。寝るための力すら残っていないというのか!寝たら起きれる保証がないくらいのエネルギー残量だから寝ないようにしているとでも言うのか! ここ最近ずっと眠い眠い言ってる眠い— daiiz (@daizplus) 2025年4月21日

  • PerplexityのMCPサーバーを試した

    以前に環境を整えたClaude Desktopで試していく。JSON-RPC 2.0やModel Context Protocolの仕様もPhonnoでざっくり読んだので裏側で起きていることも想像できるようになった。いよいよ実物を動かして挙動を観察していくフェーズに突入。 daiiz.hatenablog.com daiiz.hatenablog.com 下記のサーバーをREADMEに従って追加する。コードを読むと import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js"; で実装されている…

  • 山科

    松屋の店舗限定メニュー「水煮牛めし」を食べるためだけに山科(やましな)に行ってきた。前回の水煮と同じく、期待通りに美味しかった。牛めしと組み合わせることで松屋の強みをより活かした作品に仕上がっていた。水煮の辛さが若干手加減された感じはするものの、唐辛子と花椒の痺れ具合は健在だったのでよかった。 リピートしたいところだが、乗り換え有りの片道30分で通うのは大変そう。駅前の本屋とスタバの雰囲気も気に入ったことだし、週末だけならいいか? 水煮牛めし並盛 前回の水煮牛肉に挑戦した日記はこちら💁‍♂️ daiiz.hatenablog.com

  • Phonno: 画像の視覚的な説明生成機能でもo4-miniを採用

    昨日に引き続き、OpenAIの新モデルの採用と調整を進めている。 daiiz.hatenablog.com 画像画面でDescribe with AIボタンから使える機能。画像の説明文がo4-miniで生成されるようになりました。これまでのgpt-4oよりも視覚的に読み取れる情報が丁寧に描写されます。ここで生成(もしくは手書き)した説明文は検索インデックス構築時にも参照されるため、手厚く書くことでより探しやすくなります。 画像の特定の領域に関する説明の生成結果の例 Phonno’s visual explanation generator for images & annotations no…

  • Phonno: gpt-4.1, o4-miniを部分的に採用

    チャット用のモデルの選択肢のひとつであったo3-miniをo4-miniに更新した。 Phonno now supports o4‑mini! 🎉— daiiz (@daizplus) 2025年4月17日 長考型のモデルなので出力に時間がかかってもどかしいが、他のモデルと比べるとそれなりにポイントを抑えた端的な回答が得られる。薄い本『LLM時代の検索を考える観察日記』を収録したボックスにおける、クエリ「SGEの特徴は?」に対する答えの例を以下に示す。 o4-mini での回答(2025/4/18 時点) claude-3.7-sonnet での回答(2025/4/18 時点) また、検索画面…

  • いま熱いものLT大会で登壇した

    LAPRASさんのイベント「【集え!関西エンジニア】いま熱いものLT大会」でLTしてきた。会場はグラングリーン大阪 北館、さくらインターネットさんのイベントスペース Blooming Camp。 bloomingcamp.sakura.ad.jp 発表資料はこちら。来場者に楽しんでもらえたようでよかった。これから大阪万博の会期中は毎日ミャクミャク様の変異体を生成していきます。懇親会でもSVGやLLM、AIエージェントの情報交換ができた。声掛けてくれた皆さんありがとうございました! scrapbox.io ライブ生成がギリギリ間に合ってよかった。Blooming Campでミャクミャクが生まれた…

  • 火曜日

    コメダ珈琲 カラムーチョ チキンバーガー でかい!

  • PhonnoでMCPのschema.tsを読む

    MCP完全に理解した。理解したそばから古い知識にはなりそうだけども。— daiiz (@daizplus) 2025年4月9日 GitHubで提供されているModel Context Protocol(MCP)のスキーマ定義ファイルをPDF化してPhonnoに取り込んで読んだ。 github.com 気になる箇所をLLMに解説してもらいながら勉強を進めていける。 画像の領域を指定してAIに説明してもらう例。人間が説明を書くこともできる。検索強化のためにメタデータとしても使用される。 ソースコード中の型定義とコメントを駆使して思考チャートを作れる。 ResourceTemplate型の図解 サー…

  • 日曜日

    まだ壊れたWi-Fiルーターの買い替えができていなくて、有線LAN接続されたPixel Foldが代役を頑張っている。 "イーサネット。"

  • 帰京

    京都に帰ってきた。大混雑。みんな万博行くのかな。 東海道新幹線 京都駅 駅でミャクミャクを見すぎてポン・デ・リングを食べたくなった。ミスドで珈琲休憩。クレジットカード決済できるようになっていた。 ポン・デ・宇治抹茶 黒糖わらびもち

  • イベント当日

    Helpfeel Tech Conf 2025、無事に終了しました!お疲れ様でした!! 資料の公開準備が整ったら登壇レポートを書きます📑 各自好きなイラストを描けるタイプの名札 左上から時計回りに、Helpfeelロゴ、Gyazo忍者、Cosenseビーバー

  • イベント前日

    明日のイベント登壇に向けて東京入りした。 去年の発表の続きとして話ができそう。告知しておいた。 Helpfeel Tech Conf 2024での発表の最後で研究中の取り組みとして触れた、意図予測検索の進化系の話をします。 (画像は去年のスライドです)#helpfeel_tech https://t.co/DKryiSzsB3 pic.twitter.com/7uaCUCOXoE— daiiz (@daizplus) 2025年4月10日 通し練習はするものの、完璧なカンペを用意するよりもその場のノリで話を組み立てる方が好き。ただ、伝えようと思っていたことが抜けてしまうのは良くない。伝えるべき…

  • 水曜日

    突然体調が戻ってきた。杉とヒノキの花粉に振り回されている。来年は対策を考えたいところ。金曜日のイベントで使う発表資料の手直しをした。たぶんいい感じ!マウスのホイールがキュッキュと鳴いている。 普段睡眠が足りなすぎて保留になっていたアップデートパッチがこのダウン期間で一気に当たった感じがする— daiiz (@daizplus) 2025年4月9日 セブンイレブンのラーメンサラダ ラーメンサラダのメンサの部分 Google AI StudioでGemini 2.5 ProにRAGの説明用の図を描いてもらった。一発でこれを出せるのすごいと思う。SVGで出力しているので編集も簡単。 RAG(Retr…

  • 火曜日

    ハンバーガーの包装紙にEthernetアダプターが繋がれているユーモラスな画像。木目のテーブルの上に置かれている。

  • たまご雑炊

    花粉症をこじらせてダウンしております。お粥を食べます。— daiiz (@daizplus) 2025年4月7日 たまご雑炊美味しい。ケンタッキーのフライドチキン食べたい。回復しつつある。

  • Phonno: 関連画像の思考チャート

    画像ページにおいて、関連画像リストに関する思考チャートも生成できるようになった。下図の例のように、論文の1ページ目でこの機能を実行することで、論文全体を通して重要な知識の概要を構造化できる。関連画像欄にはこの論文の他のページに加えて、別途収録したコンテンツがサジェストされており、これらを有効活用できる。 Related imagesに基づくフローチャート Claude Codeによるアピールタイム 今回のメイン実装担当者であるClaude Code氏のコメントです。 「Ask the Flow」の新オプション「Related images」で複数の関連画像の知識を一度にグラフ化 画像間の共通テ…

  • 一日中寝ていた。そしてまた寝る。おやすみ世界。

  • Claude Code デビュー

    Phonnoの開発でClaude Codeを使い始めた。Dockerコンテナ内で動かせるので安心安全。明日からたくさん働いてもらうぞー! Claude Code 起動成功 力試しとして、昨日の記事で紹介した機能の実装をソースコードから探して説明してもらった。だいたい合っている気がする。Box Descriptionと命名してしまったけれどClaudeが書いているBox Overviewのほうがいいな。 daiiz.hatenablog.com # Claude日記: Box Overview Generation機能の調査 ## 2025-04-04 ### 機能概要 - ブログ記事「http…

  • Phonno: Boxの概要生成

    Boxに収録されている画像ソースをざっくり理解して、概要を生成できるようになった。画像を新たにアップロードしたときや、雑多なテーマを扱っていて様々な切り口から書けそうなときは適当なタイミングで再生成される。 概要を書くためにLLMが一度に読めるコンテンツ量には限りがあるので、でかいデータセットの場合はランダムに選択している。無作為に選ばれた画像郡から新しい概要を作り、既存の概要とミックスする。この二段構えにすることで、過去の生成結果も適度に取り込みつつ新鮮さも得られていい感じだった。ランダム凝縮と名付けた。GraphRAGのコミュニティ要約のアプローチも気になるので時間をみつけて実験してみたい…

  • 水曜日

    良いニュースと悪いニュースがある。 悪いニュース 行きつけのすき家が閉まっていてモーニングを食べられない Kyashに残高を回収されていた Kyashに500円ほど吸い込まれた模様— daiiz (@daizplus) 2025年4月2日 Kyashのアカウントは閉鎖されていて直接は確認できていない。連携していたマネーフォワードでわかった。もうそこにはない星を時差で見る天体観測のようだ。星が崩壊したあとに発生した粒子を観測できるかもしれないからもう少し見ておこう。 個人開発のGCPの先月の請求が3000円も増加した Artifact Registryの利用料(オレンジ色)だった daiiz.h…

  • 新年度

    今日の日付画像での、年度初め恒例の桜イラスト。このデザインももう5年目だ。来年は差し替えようかな。2025年度も頑張りましょう!

  • 年度末

    今月は安定してコードを書けた。 お疲れさまでした! 千疋屋 苺のムース

  • 日曜日

    京都に帰ってきた。 新横浜駅にて。 京都駅にて。八条東口から出たほうが地下鉄への乗り換えは便利なのだけど、雰囲気が明るいこっち側を使いがち。 日常の何気ない瞬間を積極的に写真に残していきたい。

  • 土曜日

    南町田グランベリーパーク

  • 金曜日

    来月上旬の Helpfeel Tech Conf 2025 での登壇に向けて散髪してきた。髪型がより自然な雰囲気になるために2週間のバッファを設けている。そろそろ発表資料を書かないと! 発表資料を書いていこう! https://t.co/78cMqj6Rfv— daiiz (@daizplus) 2025年3月28日 帰りにベローチェでドライカレーを食べた。 本日の京都タワー。標準カラーでのライトアップの姿。 昨晩はAIと会話して夜更かししてしまったので今日は早く寝たい。

  • Claude DesktopでMCPサーバーに入門した

    Claude DesktopでModel Context Protocol (MCP) サーバーを接続し、ローカルファイルを操作できるようになった。自分の関心領域としてMCPの世界にどれだけ深入りするかはまだ分からないものの、漠然と苦手意識を持ちたくない、かつ、議論にはついていきたいので人並みに触っていきたい。思いがけないアイデアを閃く可能性にも期待している。今日のところは @modelcontextprotocol/server-filesystem を使ってチャットログを書き出したり、超小規模なRAGみたいなことができた。次はこれの実装を読んでオリジナルなサーバーを書きたい。 タスクバーに…

  • 算数

    Duolingoで数学(まだ算数レベル)をやっている。50日続いた。四則演算の表現方法がなんか独特な世界観で面白い。ブロックを5, 10区切りで数える癖をつけさせようとしている感じがする。例えば正解が「27」になる問題では、でかい塊が2つあって半端なブロックが2個転がっているやつを選べばいい。視覚的に即答できるようになってくる。 答えをズバリ数字として入力するだけでなく、数直線上でスライダーを動かして答える問題も多い。おかげで四分の一の場所をピンポイントで選ぶのがうまくなった。 このゆるい世界観でどこまで難しい問題に挑めるのか、不安を抱きつつも続けてみる。いまのところは文章題の英語の理解の方が…

  • life.txt

    実世界で見聞きしたもの、食べたもの、体験したこと、考えたことを全部LLMのコンテキストに載せたい。人生を記述して、対話を可能にし、自律的に新しい作品を生み出すための技術を探究していこう。プロジェクト life.txt、ここに始動。 Long ≪ Life context

  • 月曜日

    カレー、タイ米、月曜日

  • Phonno: PDF画像のページ送りに対応

    PDF画像のページ送りに対応した。Phonnoでは、PDFファイルがアップロードされたとき、各ページを画像に分割して保存している。この際にページ画像の順序を保持しているため、前後のページに移動できる。データ構造的には独自のドキュメントビューワを作るための下準備が整っている。あとは時間をみつけてイケているUIを書いていきたい。 気の向くままに検索してもっともらしい画像に着地したのち、周辺ページを読み進めて前提知識や関連情報を獲得できる。 移動時のガタツキもなるべく早くなんとかします。

  • 急に暑くなった! 22度!?— daiiz (@daizplus) 2025年3月22日 洗濯が捗ったのはよかったけれど、とにかく目が痒い!!

  • 祝日の翌日

    NotebookLMにマインドマップ機能が追加されていた。 Phonnoで研究開発中の思考フローチャート生成も負けていられないな! daiiz.hatenablog.com グーグルに先駆けて似たものを出せていたのは先見の明がある感じがしてなんか嬉しい。

  • 祝日

    まだまだ寒い。花粉症で頭の回転が悪いなりにコードを書きまくった一日だった。焼きそばを食べて寝よう。

  • Geminiに改行爆弾を送り込まれることがあって困っている。 結構な頻度でGeminiに改行爆弾を送り込まれることがあって困っている pic.twitter.com/8vy1IiwpqU— daiiz (@daizplus) 2025年3月19日 pic.twitter.com/dJNtxCJD4n— daiiz (@daizplus) 2025年3月11日 こちらは-1爆弾。 pic.twitter.com/bEQq5YhMKM— daiiz (@daizplus) 2025年2月26日 出力トークン長をめいっぱい使って送ってくるので待ち時間も長くなる。この文字列が課金されるのも気に食わない…

  • 🌏️🔌

    自宅のWi-Fiルーターが壊れてしまった。本日は有線接続でお送りします。 持っててよかったEthernet to USB-C変換ケーブル。

  • Artifact Registry移行の駆け込み対応

    個人開発で運用している複数のGCPプロジェクトで警告が出ていた。いよいよ期限が迫っているので着手。ドキュメントを読みつつ提示されたコマンドを実行するだけで無事に移行できた。新たな環境での権限付与のレビューだけ大変だった。Container Registryに保存されていたDocker imageが全部コピーされて時間がかかった。もはや参照されていない古いやつは予め消しておけばよかった。2022年の懐かしいimageも出てきた。 対応完了した。「今日の日付」画像、点描画変換ツール、miilClient、Phonno、Chronicle、Snapshot machineなどがすべて救われた。めでた…

  • 湘南藤沢 3

    午前中は開発の議論をして、午後は鎌倉でフレンチイタリアンをいただいた。 小学校の遠足ぶりの小町通り ブイヤベース、牡蠣、セロリの新芽 サーモン、バジル、マンゴーソース。クラスタリングの可視化を思い出した。 daiiz.hatenablog.com daiiz.hatenablog.com 鯖、マンゴー、カリフラワーソース モチモチ食感のパスタ、猪肉のラグー。猪肉のRAG。この料理と一緒に出されたワインが好きだった。写真を撮り忘れた。 めっちゃ美味しい豚肉 2種類のチョコレート

  • 湘南藤沢 2

    夕方まで爆睡したあと、藤沢で id:kanata_02くんとディナーしてきた。技術書典18に無事当選できたので出展の作戦会議をはじめた。TeamJとしての初の現地参戦*1を最大限に楽しめるよう、なんとしても新刊を書きたい。執筆スケジュールを綿密に組もう。他にも万博やWWDC、Mac miniの話もできてよかった。 写真を正方形で撮る(あとから切り抜くするのではなく最初から正方形で保存する)話を聞いて、試してみた。普段と構図の決め方が変わってきて難しい。まったく関係ないのに無意識にスマホの向きを変えたりしていた。言われてみればたしかにmiilやInstagramに投稿することを考えると長方形で撮…

  • 湘南藤沢

    今週末は藤沢〜鎌倉エリアに滞在予定。慶應義塾湘南藤沢キャンパスで開催された増井先生の最終講義に出席してきた。 京都に帰ったら改めてレポートを書きたい。 聴講者による最終講義の実況: https://x.com/hashtag/masui_last_lecture?src=hashtag_click

  • Geminiの画像編集能力に感動した

    3ヶ月ぶりにGeminiに感動した。前回の感動はこちら: daiiz.hatenablog.com 今回もGoogle AI Studioでのできごと。アップロードした画像をテキストで編集できるようになった。加工したい内容をプロンプトで指示するだけで画像を生成してくれる。指示と関係ない箇所はほとんど変更されない。これがすごい。 Google AI StudioでのImage Editingのデモ。クロワッサンにチョコソースをかけるよう指示している。 ここまで綺麗に画像の大部分を維持して望み通りの編集をしてくれるツールは初めて見た。素人ユーザーとしてはPhotoshopでも難しかったと思う。 ほ…

arrow_drop_down

ブログリーダー」を活用して、daiizさんをフォローしませんか?

ハンドル名
daiizさん
ブログタイトル
daizの日記
フォロー
daizの日記

にほんブログ村 カテゴリー一覧

商用