chevron_left

メインカテゴリーを選択しなおす

cancel
arrow_drop_down
  • 木曜日

    昨日に引き続き、本日のAIの無駄遣いを紹介します。ソースコードのタイポ TOOD -> TODO の提案をしてもらいました。ツイートにたくさんいいねが付いていて恥ずかしい。新幹線で揺られて書いたコードなのでこういうこともある!と言い訳しておく。 pic.twitter.com/Kw7C1Sa71D— daiiz (@daizplus) 2025年4月24日 中華食べた。美味しかった。 麻辣先生老四川麻婆豆腐、本場四川よだれ鶏、青山椒よだれ鶏

  • 水曜日

    最近のo3モデルの無駄遣いを紹介します。 正多面体 → 正多明太 → せいためんたいくん です。かわいいね。

  • 火曜日

    眠れない夜の散歩

  • 月曜日

    眠すぎる。眠いけどうまく寝れない。寝るための力すら残っていないというのか!寝たら起きれる保証がないくらいのエネルギー残量だから寝ないようにしているとでも言うのか! ここ最近ずっと眠い眠い言ってる眠い— daiiz (@daizplus) 2025年4月21日

  • PerplexityのMCPサーバーを試した

    以前に環境を整えたClaude Desktopで試していく。JSON-RPC 2.0やModel Context Protocolの仕様もPhonnoでざっくり読んだので裏側で起きていることも想像できるようになった。いよいよ実物を動かして挙動を観察していくフェーズに突入。 daiiz.hatenablog.com daiiz.hatenablog.com 下記のサーバーをREADMEに従って追加する。コードを読むと import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js"; で実装されている…

  • 山科

    松屋の店舗限定メニュー「水煮牛めし」を食べるためだけに山科(やましな)に行ってきた。前回の水煮と同じく、期待通りに美味しかった。牛めしと組み合わせることで松屋の強みをより活かした作品に仕上がっていた。水煮の辛さが若干手加減された感じはするものの、唐辛子と花椒の痺れ具合は健在だったのでよかった。 リピートしたいところだが、乗り換え有りの片道30分で通うのは大変そう。駅前の本屋とスタバの雰囲気も気に入ったことだし、週末だけならいいか? 水煮牛めし並盛 前回の水煮牛肉に挑戦した日記はこちら💁‍♂️ daiiz.hatenablog.com

  • Phonno: 画像の視覚的な説明生成機能でもo4-miniを採用

    昨日に引き続き、OpenAIの新モデルの採用と調整を進めている。 daiiz.hatenablog.com 画像画面でDescribe with AIボタンから使える機能。画像の説明文がo4-miniで生成されるようになりました。これまでのgpt-4oよりも視覚的に読み取れる情報が丁寧に描写されます。ここで生成(もしくは手書き)した説明文は検索インデックス構築時にも参照されるため、手厚く書くことでより探しやすくなります。 画像の特定の領域に関する説明の生成結果の例 Phonno’s visual explanation generator for images & annotations no…

  • Phonno: gpt-4.1, o4-miniを部分的に採用

    チャット用のモデルの選択肢のひとつであったo3-miniをo4-miniに更新した。 Phonno now supports o4‑mini! 🎉— daiiz (@daizplus) 2025年4月17日 長考型のモデルなので出力に時間がかかってもどかしいが、他のモデルと比べるとそれなりにポイントを抑えた端的な回答が得られる。薄い本『LLM時代の検索を考える観察日記』を収録したボックスにおける、クエリ「SGEの特徴は?」に対する答えの例を以下に示す。 o4-mini での回答(2025/4/18 時点) claude-3.7-sonnet での回答(2025/4/18 時点) また、検索画面…

  • いま熱いものLT大会で登壇した

    LAPRASさんのイベント「【集え!関西エンジニア】いま熱いものLT大会」でLTしてきた。会場はグラングリーン大阪 北館、さくらインターネットさんのイベントスペース Blooming Camp。 bloomingcamp.sakura.ad.jp 発表資料はこちら。来場者に楽しんでもらえたようでよかった。これから大阪万博の会期中は毎日ミャクミャク様の変異体を生成していきます。懇親会でもSVGやLLM、AIエージェントの情報交換ができた。声掛けてくれた皆さんありがとうございました! scrapbox.io ライブ生成がギリギリ間に合ってよかった。Blooming Campでミャクミャクが生まれた…

  • 火曜日

    コメダ珈琲 カラムーチョ チキンバーガー でかい!

  • PhonnoでMCPのschema.tsを読む

    MCP完全に理解した。理解したそばから古い知識にはなりそうだけども。— daiiz (@daizplus) 2025年4月9日 GitHubで提供されているModel Context Protocol(MCP)のスキーマ定義ファイルをPDF化してPhonnoに取り込んで読んだ。 github.com 気になる箇所をLLMに解説してもらいながら勉強を進めていける。 画像の領域を指定してAIに説明してもらう例。人間が説明を書くこともできる。検索強化のためにメタデータとしても使用される。 ソースコード中の型定義とコメントを駆使して思考チャートを作れる。 ResourceTemplate型の図解 サー…

  • 日曜日

    まだ壊れたWi-Fiルーターの買い替えができていなくて、有線LAN接続されたPixel Foldが代役を頑張っている。 "イーサネット。"

  • 帰京

    京都に帰ってきた。大混雑。みんな万博行くのかな。 東海道新幹線 京都駅 駅でミャクミャクを見すぎてポン・デ・リングを食べたくなった。ミスドで珈琲休憩。クレジットカード決済できるようになっていた。 ポン・デ・宇治抹茶 黒糖わらびもち

  • イベント当日

    Helpfeel Tech Conf 2025、無事に終了しました!お疲れ様でした!! 資料の公開準備が整ったら登壇レポートを書きます📑 各自好きなイラストを描けるタイプの名札 左上から時計回りに、Helpfeelロゴ、Gyazo忍者、Cosenseビーバー

  • イベント前日

    明日のイベント登壇に向けて東京入りした。 去年の発表の続きとして話ができそう。告知しておいた。 Helpfeel Tech Conf 2024での発表の最後で研究中の取り組みとして触れた、意図予測検索の進化系の話をします。 (画像は去年のスライドです)#helpfeel_tech https://t.co/DKryiSzsB3 pic.twitter.com/7uaCUCOXoE— daiiz (@daizplus) 2025年4月10日 通し練習はするものの、完璧なカンペを用意するよりもその場のノリで話を組み立てる方が好き。ただ、伝えようと思っていたことが抜けてしまうのは良くない。伝えるべき…

  • 水曜日

    突然体調が戻ってきた。杉とヒノキの花粉に振り回されている。来年は対策を考えたいところ。金曜日のイベントで使う発表資料の手直しをした。たぶんいい感じ!マウスのホイールがキュッキュと鳴いている。 普段睡眠が足りなすぎて保留になっていたアップデートパッチがこのダウン期間で一気に当たった感じがする— daiiz (@daizplus) 2025年4月9日 セブンイレブンのラーメンサラダ ラーメンサラダのメンサの部分 Google AI StudioでGemini 2.5 ProにRAGの説明用の図を描いてもらった。一発でこれを出せるのすごいと思う。SVGで出力しているので編集も簡単。 RAG(Retr…

  • 火曜日

    ハンバーガーの包装紙にEthernetアダプターが繋がれているユーモラスな画像。木目のテーブルの上に置かれている。

  • たまご雑炊

    花粉症をこじらせてダウンしております。お粥を食べます。— daiiz (@daizplus) 2025年4月7日 たまご雑炊美味しい。ケンタッキーのフライドチキン食べたい。回復しつつある。

  • Phonno: 関連画像の思考チャート

    画像ページにおいて、関連画像リストに関する思考チャートも生成できるようになった。下図の例のように、論文の1ページ目でこの機能を実行することで、論文全体を通して重要な知識の概要を構造化できる。関連画像欄にはこの論文の他のページに加えて、別途収録したコンテンツがサジェストされており、これらを有効活用できる。 Related imagesに基づくフローチャート Claude Codeによるアピールタイム 今回のメイン実装担当者であるClaude Code氏のコメントです。 「Ask the Flow」の新オプション「Related images」で複数の関連画像の知識を一度にグラフ化 画像間の共通テ…

  • 一日中寝ていた。そしてまた寝る。おやすみ世界。

  • Claude Code デビュー

    Phonnoの開発でClaude Codeを使い始めた。Dockerコンテナ内で動かせるので安心安全。明日からたくさん働いてもらうぞー! Claude Code 起動成功 力試しとして、昨日の記事で紹介した機能の実装をソースコードから探して説明してもらった。だいたい合っている気がする。Box Descriptionと命名してしまったけれどClaudeが書いているBox Overviewのほうがいいな。 daiiz.hatenablog.com # Claude日記: Box Overview Generation機能の調査 ## 2025-04-04 ### 機能概要 - ブログ記事「http…

  • Phonno: Boxの概要生成

    Boxに収録されている画像ソースをざっくり理解して、概要を生成できるようになった。画像を新たにアップロードしたときや、雑多なテーマを扱っていて様々な切り口から書けそうなときは適当なタイミングで再生成される。 概要を書くためにLLMが一度に読めるコンテンツ量には限りがあるので、でかいデータセットの場合はランダムに選択している。無作為に選ばれた画像郡から新しい概要を作り、既存の概要とミックスする。この二段構えにすることで、過去の生成結果も適度に取り込みつつ新鮮さも得られていい感じだった。ランダム凝縮と名付けた。GraphRAGのコミュニティ要約のアプローチも気になるので時間をみつけて実験してみたい…

  • 水曜日

    良いニュースと悪いニュースがある。 悪いニュース 行きつけのすき家が閉まっていてモーニングを食べられない Kyashに残高を回収されていた Kyashに500円ほど吸い込まれた模様— daiiz (@daizplus) 2025年4月2日 Kyashのアカウントは閉鎖されていて直接は確認できていない。連携していたマネーフォワードでわかった。もうそこにはない星を時差で見る天体観測のようだ。星が崩壊したあとに発生した粒子を観測できるかもしれないからもう少し見ておこう。 個人開発のGCPの先月の請求が3000円も増加した Artifact Registryの利用料(オレンジ色)だった daiiz.h…

  • 新年度

    今日の日付画像での、年度初め恒例の桜イラスト。このデザインももう5年目だ。来年は差し替えようかな。2025年度も頑張りましょう!

  • 年度末

    今月は安定してコードを書けた。 お疲れさまでした! 千疋屋 苺のムース

  • 日曜日

    京都に帰ってきた。 新横浜駅にて。 京都駅にて。八条東口から出たほうが地下鉄への乗り換えは便利なのだけど、雰囲気が明るいこっち側を使いがち。 日常の何気ない瞬間を積極的に写真に残していきたい。

  • 土曜日

    南町田グランベリーパーク

  • 金曜日

    来月上旬の Helpfeel Tech Conf 2025 での登壇に向けて散髪してきた。髪型がより自然な雰囲気になるために2週間のバッファを設けている。そろそろ発表資料を書かないと! 発表資料を書いていこう! https://t.co/78cMqj6Rfv— daiiz (@daizplus) 2025年3月28日 帰りにベローチェでドライカレーを食べた。 本日の京都タワー。標準カラーでのライトアップの姿。 昨晩はAIと会話して夜更かししてしまったので今日は早く寝たい。

  • Claude DesktopでMCPサーバーに入門した

    Claude DesktopでModel Context Protocol (MCP) サーバーを接続し、ローカルファイルを操作できるようになった。自分の関心領域としてMCPの世界にどれだけ深入りするかはまだ分からないものの、漠然と苦手意識を持ちたくない、かつ、議論にはついていきたいので人並みに触っていきたい。思いがけないアイデアを閃く可能性にも期待している。今日のところは @modelcontextprotocol/server-filesystem を使ってチャットログを書き出したり、超小規模なRAGみたいなことができた。次はこれの実装を読んでオリジナルなサーバーを書きたい。 タスクバーに…

  • 算数

    Duolingoで数学(まだ算数レベル)をやっている。50日続いた。四則演算の表現方法がなんか独特な世界観で面白い。ブロックを5, 10区切りで数える癖をつけさせようとしている感じがする。例えば正解が「27」になる問題では、でかい塊が2つあって半端なブロックが2個転がっているやつを選べばいい。視覚的に即答できるようになってくる。 答えをズバリ数字として入力するだけでなく、数直線上でスライダーを動かして答える問題も多い。おかげで四分の一の場所をピンポイントで選ぶのがうまくなった。 このゆるい世界観でどこまで難しい問題に挑めるのか、不安を抱きつつも続けてみる。いまのところは文章題の英語の理解の方が…

  • life.txt

    実世界で見聞きしたもの、食べたもの、体験したこと、考えたことを全部LLMのコンテキストに載せたい。人生を記述して、対話を可能にし、自律的に新しい作品を生み出すための技術を探究していこう。プロジェクト life.txt、ここに始動。 Long ≪ Life context

  • 月曜日

    カレー、タイ米、月曜日

  • Phonno: PDF画像のページ送りに対応

    PDF画像のページ送りに対応した。Phonnoでは、PDFファイルがアップロードされたとき、各ページを画像に分割して保存している。この際にページ画像の順序を保持しているため、前後のページに移動できる。データ構造的には独自のドキュメントビューワを作るための下準備が整っている。あとは時間をみつけてイケているUIを書いていきたい。 気の向くままに検索してもっともらしい画像に着地したのち、周辺ページを読み進めて前提知識や関連情報を獲得できる。 移動時のガタツキもなるべく早くなんとかします。

  • 急に暑くなった! 22度!?— daiiz (@daizplus) 2025年3月22日 洗濯が捗ったのはよかったけれど、とにかく目が痒い!!

  • 祝日の翌日

    NotebookLMにマインドマップ機能が追加されていた。 Phonnoで研究開発中の思考フローチャート生成も負けていられないな! daiiz.hatenablog.com グーグルに先駆けて似たものを出せていたのは先見の明がある感じがしてなんか嬉しい。

  • 祝日

    まだまだ寒い。花粉症で頭の回転が悪いなりにコードを書きまくった一日だった。焼きそばを食べて寝よう。

  • Geminiに改行爆弾を送り込まれることがあって困っている。 結構な頻度でGeminiに改行爆弾を送り込まれることがあって困っている pic.twitter.com/8vy1IiwpqU— daiiz (@daizplus) 2025年3月19日 pic.twitter.com/dJNtxCJD4n— daiiz (@daizplus) 2025年3月11日 こちらは-1爆弾。 pic.twitter.com/bEQq5YhMKM— daiiz (@daizplus) 2025年2月26日 出力トークン長をめいっぱい使って送ってくるので待ち時間も長くなる。この文字列が課金されるのも気に食わない…

  • 🌏️🔌

    自宅のWi-Fiルーターが壊れてしまった。本日は有線接続でお送りします。 持っててよかったEthernet to USB-C変換ケーブル。

  • Artifact Registry移行の駆け込み対応

    個人開発で運用している複数のGCPプロジェクトで警告が出ていた。いよいよ期限が迫っているので着手。ドキュメントを読みつつ提示されたコマンドを実行するだけで無事に移行できた。新たな環境での権限付与のレビューだけ大変だった。Container Registryに保存されていたDocker imageが全部コピーされて時間がかかった。もはや参照されていない古いやつは予め消しておけばよかった。2022年の懐かしいimageも出てきた。 対応完了した。「今日の日付」画像、点描画変換ツール、miilClient、Phonno、Chronicle、Snapshot machineなどがすべて救われた。めでた…

  • 湘南藤沢 3

    午前中は開発の議論をして、午後は鎌倉でフレンチイタリアンをいただいた。 小学校の遠足ぶりの小町通り ブイヤベース、牡蠣、セロリの新芽 サーモン、バジル、マンゴーソース。クラスタリングの可視化を思い出した。 daiiz.hatenablog.com daiiz.hatenablog.com 鯖、マンゴー、カリフラワーソース モチモチ食感のパスタ、猪肉のラグー。猪肉のRAG。この料理と一緒に出されたワインが好きだった。写真を撮り忘れた。 めっちゃ美味しい豚肉 2種類のチョコレート

  • 湘南藤沢 2

    夕方まで爆睡したあと、藤沢で id:kanata_02くんとディナーしてきた。技術書典18に無事当選できたので出展の作戦会議をはじめた。TeamJとしての初の現地参戦*1を最大限に楽しめるよう、なんとしても新刊を書きたい。執筆スケジュールを綿密に組もう。他にも万博やWWDC、Mac miniの話もできてよかった。 写真を正方形で撮る(あとから切り抜くするのではなく最初から正方形で保存する)話を聞いて、試してみた。普段と構図の決め方が変わってきて難しい。まったく関係ないのに無意識にスマホの向きを変えたりしていた。言われてみればたしかにmiilやInstagramに投稿することを考えると長方形で撮…

  • 湘南藤沢

    今週末は藤沢〜鎌倉エリアに滞在予定。慶應義塾湘南藤沢キャンパスで開催された増井先生の最終講義に出席してきた。 京都に帰ったら改めてレポートを書きたい。 聴講者による最終講義の実況: https://x.com/hashtag/masui_last_lecture?src=hashtag_click

  • Geminiの画像編集能力に感動した

    3ヶ月ぶりにGeminiに感動した。前回の感動はこちら: daiiz.hatenablog.com 今回もGoogle AI Studioでのできごと。アップロードした画像をテキストで編集できるようになった。加工したい内容をプロンプトで指示するだけで画像を生成してくれる。指示と関係ない箇所はほとんど変更されない。これがすごい。 Google AI StudioでのImage Editingのデモ。クロワッサンにチョコソースをかけるよう指示している。 ここまで綺麗に画像の大部分を維持して望み通りの編集をしてくれるツールは初めて見た。素人ユーザーとしてはPhotoshopでも難しかったと思う。 ほ…

  • ハッピーセット

    マクドナルドのハッピーセットで、チキンナゲットのおもちゃをゲットした。 ハッピーセットのチキンナゲットのおもちゃゲットした pic.twitter.com/iT2Jx2KnOI— daiiz (@daizplus) 2025年3月12日 自作のナゲット形状分類器にもかけてみる。全体的に丸みが強いせいで判別に苦戦していた。これまでの実験では、本物のナゲットに対しては、RGBフルカラー写真で学習したモデルで最もよい結果が得られる傾向があった。しかし今回のおもちゃを対象にしたときは、輪郭線画像データで学習したモデルが安定していた。また、いずれのケースにおいても二値化画像(白黒画像)のモデルはほとんど…

  • Phonno: PDFファイルに対応

    PDF文書の入力に対応しました。ファイルを選択するだけで、全ページが自動で画像化されてPhonnoに取り込まれます。 つぎは、対象の題材をとことん読んで理解するための支援機能を作りたい。せっかくLLMという最強の武器を手に入れたのだから、概要を雰囲気で把握するのではなくて、完全に納得できるまで寄り添ってくれる文書・画像ビューワを目指したいところです。超検索型ドキュメントビューワ。

  • ハニーとマスタード

    マクドナルド、モスバーガー、ケンタッキーをだいたい攻略したので、次はロッテリアに進出していきたい。ハニーマスタード チキンフィレバーガーを食べた。美味しい。フライドポテトも好みのタイプでいい感じだった。 撮影: Pixel 6a、加工: Foodie

  • ネムスギルのスギの部分

    春の服を見てきた。とは言ってもまだ急に寒くなったりするので油断はできない。冬のコートをクリーニングに出すのももう少し待ったほうがいいかもしれない。 花粉症のせいでものすごく眠くて、思考力がGPT-3.5 Turboくらいになっている。体調が万全でないときは深く考えないほうがいい。これまでの経験でようやくわかってきたけれど、ここでなんとか力を振り絞って複雑なことをやったとしても、後からほとんどやり直す羽目になる。さほど頭を使わなくても淡々とこなせることだけをやって、あとは寝ておくに限る。 こんな状況でもWhiskは楽しめる。 daiiz.hatenablog.com https://x.com/…

  • Phonno: 画像リストのレイアウトシフトを軽減

    検索画面の画像リストのSkeleton loadingを実装した。これまでは画像リストの初期高さが0pxであったため、画像の読み込み完了前後でガタツキ(レイアウトシフト)が大きかった。全体的にだいぶ良くなった。あとは説明文とキーワードサジェスト領域も同じように対応できたら完璧だ。 Chrome Dev Toolsで Slow 4G 回線をシミュレーションした様子。 おまけ 個人開発のGitHubリポジトリにGemini Code Assistをインストールおり、AIにコードレビューに参戦してもらっている。自動生成されるPull Requestのサマリーで英語を勉強できる。今日は jarring…

  • 相棒 123%

    外出時に持ち歩いているメモ帳。コンビニで売っているやつ。ふと思いついたアイデアを書き留める。大事なページはコピーして自宅のフォルダで保管する。見開きでコピーするとき、B5紙面に収まるように拡大するには 123% (ほぼA5 -> B5) を指定すればいい。語呂が良くて覚えやすい。コピーを終えたらページをミシン目で切り取って破棄する。街中で落としても安心! www.kokuyo-st.co.jp カットオフノート5号(A6)中横罫48枚 ● 必要なページだけをきれいに切り離せる、ミシン目入りのカットオフタイプ。 ● 特殊フィルムでラミネート加工したクロスを採用。背が破れにくいだけでなく、ボールペ…

  • バターとメープルシロップ

    京都駅のカフェでパンケーキを食べた。 AIがコードを書いてくれるようになったら、パンケーキとハンバーガーを巡る旅をしたい。

  • Phonno: キーワードの概要パネルにも思考チャートを表示する

    表題の通り、キーワードの解説が生成されるパネルに、関連用語や関連概念を示すフローチャートが表示されるようになりました。Ask the Flow機能の発展形です。現状ではリアルタイムで生成するため少々時間がかかりますが、生成結果の保存と再利用の仕組みを(AIが)実装中なのでそのうち爆速になります。 Bigtableに関する知識整理の例 daiiz WikiでのChatGPTに関する説明の例(デモ) その他のアップデート 画像配信: 大量のサムネイル画像が読み込まれる検索画面が安定しました。初期描画完了までの時間が短縮されます。Cloudflare R2オブジェクトのPresigned URLを作…

  • クラッカー レーズンバター

    大学時代からの友人が久しぶりに京都に来たので飲んできた。僕が大学院を中退して地元から引っ越したりといろいろあったけれど、知り合って12年経ったいまでも、こうして定期的に会って盛り上がれるのは本当にありがたい。 daiiz.hatenablog.com

  • PosterLM構想(下調べ編)

    花粉症で目が痒くて文字を読むのがしんどい。Deep Researchの長文レポートをポスター形式でまとめて一撃で概要を把握したい。ウェブUIから o3-mini-high、Claude 3.7 Sonnet、Gemini 2.0 Flash Thinking を試してみた。自分でロジックを組む前に、何事もまずはAIの実力に任せてみて課題を探るのがいい。ということで情報の取捨選択からレイアウトまでやってもらう。プロンプトを調整すればもっといいものが出るだろうが、今後の開発戦略を考えるためのベースラインということで。 入力内容 Deep Researchの結果(Markdown形式のテキスト) プ…

  • 海鮮丼

    トンカツを食べようと思って出掛けたが、お店を間違えて海鮮丼になった。

  • Phonno: 思考フローを生成する機能を一般開放

    Phonnoでの思考フロー生成(Ask the Flow)機能が誰でも使えるようになりました🎉 検索画面と画像プレビュー画面でフローチャートを生成できます。 API料金の都合でこれまではログインしているユーザーのみに開放していましたが、今日からはログイン状況に関わらず利用できます。ボックスの編集者だけでなく、検索専用ビューの利用者にも触ってもらえるので嬉しいです! GPT-4o, o3-mini, Claude 3.5 Sonnet と試してきましたが、精度はそこそこ満足できても料金や速度面で課題が残っていました。先日 Gemini 2.0 Flash が一般提供開始されたことで選択肢が増え、…

  • 2月末の焼きおにぎり

    生活圏内なのに7年間も気付けなかった飲み屋でご飯を食べてきた。どれも美味しい!今度時間があるときに他の料理やお酒も冒険したい。 なんと2月が終わってしまいました。今月も読んでくださりありがとうございました。来月はもっと充実したコンテンツをお届けできるよう頑張ります💪 PhonnoのPDFファイル対応間に合わなかった...!

  • 今週のお題「本屋さん」

    今週のお題「本屋さん」 物心ついてから大学時代までお世話になった、地元神奈川の有隣堂を応援している。YouTubeチャンネル『有隣堂しか知らない世界』がおもしろい。ブッコローというミミズクのキャラクターのMC力がすごい。動画に出てくる書店員さんたちの個性が光りまくっている。 ここ最近、関西にも進出しつつあって嬉しい。このあいだはお洒落な神戸店に行ってきた。 熱心なファンなのでグッズも買っている。ブッコローのLaQを組み立てたり、イメージカラーの橙羽色(とわいろ)の限定インクを買ってみたり。 オフィスにぬいぐるみも住まわせている。退社時間になると心做しか疲れているようにも見える。 YouTube…

  • 長文を喋るようになった

    PhonnoでAnthropicの最新モデルClaude 3.7 Sonnetを選択できるようになりました。 3.5 -> 3.7 にバージョンアップした いつもの「daiiz Wiki」のデモも更新しておきました。 https://phonno.org/_d7ad2f536ace4d21ae9f8fb833194482 実際にRAGを試してみると、前のモデルよりも出力文章が長くなる傾向が見られた。この現象を良いように捉えて、些細な情報も最大限に拾って回答構築されるようになったと考えてもよい。しかし逆に冗長で歯切れが悪くなったとも言える。 生成結果は読み物としては面白いのでしばらくは静観しつつ…

  • 辛さを求めて

    麻婆豆腐か麻婆茄子を食べたい! 麻婆〇〇をいろいろ冒険したい。 今日のランチはAIセレクトでシャカシャカチキンを食べた。マクドナルドで辛いメニューを満喫するデッキを作ってもらった。Red Pepperの粉が辛さの要素だった。 Shaka Shaka Chicken🍗

  • 11時間寝た

    いちご 桜 ソイ ラテ

  • Zigzag Harmony

    OpenAI OperatorにSVG Drawingsを使ってイラストを描いてもらった。SVG Drawingsは僕が自作しているお絵かきツールです。初めてのAIユーザーを獲得した記念すべき瞬間です。 Zigzag Harmony このイラストには「Zigzag Harmony」という題名を提案します。ジグザグのパターンと線が調和している様子を表現しています。いかがでしょうか? by OpenAI o1 SVG Drawingsでは書いた順番も保存されている。今回の絵はこんな感じ: 最初から再生 document.querySelector("#zzzbtn").addEventListen…

  • 新作20250217

    新作20250213の派生として開発が進んでいる。できたてのプロジェクトに名前をつけると固定観念が生じてしまうため、ある程度の方向性が見えるまでは日付で呼んでいる。 scrapbox.io 最初のデモがデプロイされてフィードバックも貰い始めた。ついにコードネームも割り当てた。この三連休は優先度が高い実験を進めている。 日付は引き続きバージョン番号として使われる。 食事 ガパオライス+目玉焼きトッピング

  • TeamJ.fm #2

    友人のid:kanata_02くんとやっているポッドキャスト「TeamJ.fm」の第2回を公開しました。技書博11参加のために宿泊した横浜のホテルで収録した回です。普段CosenseやTwitterでは技術ネタをメインで発信しているので、ブログとラジオでは日常生活にフォーカスしていきたい。 チェックアウトまでの空き時間で素早く録音できてすごかった。kanataくんが良さげな機材を持ってきてくれるので毎回楽しみ。ピンマイクをつけると話すぞという気持ちになってくる。 横浜滞在期間中の日記も貼っておきます。もう懐かしい。 daiiz.hatenablog.com daiiz.hatenablog.c…

  • 木曜日

    同僚とランチ。親子丼美味しい。 コンビニで試験販売していた飴。本当に味がなかった。 読書。だいぶ前に少しだけ読んだことがあったけれど、今のほうが圧倒的に解像度高く理解できる。めっちゃ面白い。 そして、12日ぶりにまた暖房が効かなくなった。凍えて寝る。 daiiz.hatenablog.com

  • LLM時代の開発のセンス

    LLM時代のソフトウェア開発の戦い方が分かってきた。 戦い方が分かってきた。来月にはまたわからなくなっていそうだけども。— daiiz (@daizplus) 2025年2月19日 Google製の楽しい生成AIサービス「Whisk」を見つけた。複数の画像やテキストを組み合わせて新しいテイストの絵を生成できる。Vertex AIでImagen 3のAPIも開放されたので画像生成系の遊び方を再び模索したい。 blog.google かわいい世界観のケンタッキーのツイスター このWhiskだけでなく、Google AI Studio、ImageFX、NotebookLMなどなど、最近のGoogle…

  • ソフトパステル・レインボー

    o1 Proと一緒にめっちゃいいSkeleton loadingのSVGを描いた。パステルカラーで落ち着きがありつつもキラキラしていて綺麗!! 白色の台紙に溶け込む配色になっている。上手いものがひとつできればこっちのもので、カラーバリエーション展開やスピード調整などはAIが勝手にやってくれる。量産タスクでは、4oやClaudeなどのCanvas機能を持っているモデルを使うといい。 カンデミーナグミを食べながらプレビューされた作品を審査していくだけでよし。嬉しいですね。

  • 琵琶湖が見えるホテル

    先々週の週末は大津のホテルで過ごしていた。開発の勢いがつき過ぎてしまったのでクールダウン。しかし結局、部屋でコードを書いていたのであまり効果はなかった。 バブル期に建てられた施設が好き。今回のホテルもこれだった。必要以上に派手な演出があったり、空間を贅沢に使っていたりと、いまでは考えられない設計で好き。広いフロアを数店舗だけで占有していたせいで、1, 2個でも閉店するとだいぶ寂しい雰囲気になる。93年生まれなのでバブル自体は体験したことはないけれど、この場所も昔は賑やかだったのかなあ、とか思いを馳せる。 床の形も曲線だったり入り組んでいたりする。こんな変な形なのによくも綺麗に絨毯敷き詰めたもの…

  • オーガニックコーヒー

    ホテルのコーヒー

  • ステッカー

    昨日のポーチにつづき、ZOZOTOWNとGitHubのコラボ企画で注文していたステッカーが届いた。別便でやって来た。忘れていたものが届いて嬉しさ倍増!! 点描タッチのOctocatがかわいい。GUIコンポーネントもいいね。実世界で触れる<button>だ。一番右のやつはGitHub Copilotくんではないか! 実世界で触れるシリーズ scrapbox.io

  • ポーチ

    ZOZOTOWNとGitHubのコラボ企画で注文していたポーチが届いた。忘れていた頃に届いて嬉しさ倍増!! リュックの中で絡まっているケーブル類を収納していこう。

  • 午後の紅茶 レモンティー カロリーメイト はちみつのど飴

  • Yeasts

    LLMを扱ううえで、ハルシネーションとクリエイティビティは紙一重だと考えている。仕事ではハルシネーション抑制のためにクリエイティビティをあまり追求しない系の開発がメインなので、個人開発では生成AIにとことん創造性を問うてみたい。 Yeasts(酵母)は、Phonnoを使った実験的な取り組みの一つ。蓄積された画像を組み合わせて新しいアイデアを生み出そうというもの。LLMに自由にアイデアの種を量産してもらい、いい感じのものが出てくるのを待つ。もしもよさげな種が出てきたら培養してプロダクトにしていく、という目論見で進めている。 毎日ドッグフーディングしているInternal Phonnoには、パソコ…

  • 火曜日

    https://io.google/2025/puzzle 全ステージクリアした!! I’ve solved the entire Google I/O puzzle and unlocked the full spectrum of light! My journey ends here, but the glow lives on. Can you solve it too? #GoogleIO https://t.co/HcpdnVYZgc— daiiz (@daizplus) 2025年2月11日 バッジもゲット! https://developers.google.com/profi…

  • ビリヤニの火曜日

    マトンビリヤニと豆のカレーをいただきました。壺の底まで温かいご飯が詰まっていて最高だった。ヨーグルトソースをかけて変化した味も美味しかった。

  • PhonnoにGemini 2.0 Flashを搭載した

    一般公開版のPhonnoのGeminiモデルのバージョンをアップデートした。 Gemini 2.0 Flashを選択できる 自分だけが使えるクローズドなPhonnoではGemini 2.0 Proと2.0 Flash thinkingも試している。Proは賢さが垣間見れていい感じ。最近の推しのClaude 3.5 Sonnetといい勝負をできるかもしれない。Vertex AIでExperimentalが外れたら公開版にも搭載したい。 クローズド版で試用中のモデルたち Gemini 2.0 Flash thinkingのAPIに仕様変更があり、思考パート(thoughts part)を返さなくな…

  • ❄️❄️❄️

    さっむい!!風呂で暖をとるしかない。 エアコンから冷たい風しか出なくなり、WiFiも落ちた— daiiz (@daizplus) 2025年2月8日 WiFiの代替はテザリングで対処可能だが、テザリングでは暖はとれない。明日の朝までに直らなかったら非常事態宣言だ。

  • 一夜にして読めるものが増えた

    気温が急に下がって雪が降り始めた。 読書 『これからのAI、正しい付き合い方と使い方』 第8章 「コーチ」としてのAI (途中まで) 調査 Gemini 2.0 の新しいAPI Pro, Flash, Flash-Lite, Flash thinking たくさんある! Flash-Liteが登場したことで自分の中でFlashの位置づけがよくわからなくなっている。軽量モデルの軽量版? ProとFlashをPhonnoに搭載しようと思う。明日にはできるはず。 PythonでmacOSのネイティブアプリを書くための知識。なかなか手を出せていなかった領域。ChatGPT o1の助けによってやる気が出…

  • 開発が捗った木曜日

    気分転換にWindowsマシンの壁紙を変えた。ポテトチップス コンソメ味を食べたくなってきた。 Surface Laptopの壁紙

  • 雪が舞う水曜日

    開発 新作2つが進行中。 新作20250203 - daiiz 新作20250204 - daiiz 読書 『これからのAI、正しい付き合い方と使い方』 第3章 「共同知能」についての4つのルール いまいちイメージできなかった表現をGeminiに図解してもらった。解釈あっているだろうか? 私と共著者が「AIのギザギザな境界線」と呼ぶ現象だ。要塞の壁を想像してみてほしい。いくつかの塔や胸壁が野原まで突き出ていて、その一方で別の塔や胸壁は城の中心に向かって折り返されている。この壁がAIの能力であり、城の中心から離れるほど、タスクが難しくなる。 「これからのAI、正しい付き合い方と使い方 「共同知能…

  • 冷え込んだ火曜日

    ブランケットは温かい Phonno Ask the Flow機能で論文を読んでみている。 Attention Is All You Need 論文のアブストラクト セマンティック・ウェブ論文でのオントロジーの説明 読書 『これからのAI、正しい付き合い方と使い方』 第5章 「創造性」としてのAI 第9章 「未来」としてのAI サブスク 巷で話題になっているDeep Research機能を試してみたさでChatGPT Proを契約した。OpenAIの発表動画でも「ウェブ検索の新しいUI」的に紹介されていたので操作性の観点からも研究したい。今日からプロです。何でも聞きます。 ご報告: ChatGP…

  • お休みな月曜日

    カレーを食べた。 Xのタイムラインに流れてきた本を買った。移動中に目にとまって、美容院の予約時刻までの待ち時間に本屋に立ち寄って買えた。最速購入。プロローグがうまくて引き込まれた。とりあえず5章を読みたいな。 二週間半ほどずっと左胸〜腕〜指先が痺れて痛かったのでいよいよ整形外科に行ってきた。小胸筋症候群(胸郭出口症候群)と診断された。要するにデスクワーク時の姿勢が悪い。ストレッチの仕方を教わった。

  • 画像ページにもAsk the Flow機能を実装した

    先日Phonnoの検索画面に導入した「Ask the Flow機能」を画像そのもののページでも使えるようにしてみた。 daiiz.hatenablog.com 下記のようなスクリーンショット*1をPhonnoにアップロードすると、LLMが画像に書かれていることを理解して、物事を考えるための手順をフローチャートで表現してくれる。 記事のスクリーンショットの例 画像の関連データを掲載するセクションでチャートが生成される。 生成されるフローチャートの例 GPT-4o, o3-mini, Gemini ともにMermaid記法の出力が不安定な問題があったが、subgraphの定義をendするたびにコメ…

  • すみません、今日は一日中ぼーっと考え事をしていました! 手を動かすべし!! 噂通り未明にOpenAIから新モデルo3-miniも発表されたので試したいところだけどとても眠い。 最近ハマっているのファミマのパンを紹介します。立ち寄るたびに毎回買ってしまう。 www.family.co.jp

  • 1月最終日

    年明けてから一ヶ月間、毎日ブログを続けられた。お疲れ様でした! この調子で2月も頑張りましょう!!

  • PhonnoのDiscordサーバーを立てた

    Phonnoの開発進捗や今後の展開のアイデアを書く場所として、Discordのサーバーを作った。仕事やプライベートでDiscordを使う機会が少ないので流行りのツールに触れるという意味合いも込めて。Discord Botの開発とかも作ってみたい。 discord.gg Phonnoと似た領域で人気のあるサービスの観察もやっていく。 技術同人誌の原稿になる前の姿のメモたちも共有していきたい。昨日紹介したFlowchartの生成など、費用がかかりすぎる実験的な機能を限定公開するためのキーを配ったりするかもしれない。 予告なく休止する可能性はありますが、誰でも来てください!

  • 💰️🤖🧠💰️

    Phonnoの「Ask the Flow」機能をリリースした。画像郡に含まれる知識からフローチャートを自動生成して理解を助けてくれる。背景情報の関係性を把握したり、大きめの問題を適度に分解して考えることができる。完璧ではないものの第一歩を踏み出せた感じはする。自分のボックスにログインしていれば使えます。 daiiz.hatenablog.com かなりトークンを消費する機能になってしまい、久しぶりにOpenAI APIの利用量が増加して驚いている。単価がかなり安くなったGPT-4oの提供が始まってからはあまり気になっていなかったが、今回はクレジットの消費の勢いが凄い。これがLong-Conte…

  • PhonnoでFlowchartを生成する

    昨日のFlowchartLMの話の続き。Ask the Flow機能の試作ができた。Joel on Software 日本語訳の一部の記事を取り込んだボックスで検索してみる。 理想の開発チームとは? ノードやサブグラフをクリックすると、そのトピックに関してさらに深堀りして検索できる。検索キーワードを超えて、検索コンテキストの生成ができるかもしれない。 ほかにも、Helpfeel社のCosenseを一部公開のCosenseでも試してみる。ノードの関係性の表現はまだまだ改善の余地があるものの、基本情報はうまいこと整理できている。(手元の実験環境のデータセットがだいぶ古いため、旧社名「Nota」でク…

  • FlowchartLM

    思いつく限りの「〇〇LM」を試作している。これは単体では面白くない。Phonnoに融合するのは良さそうかも知れない。 明日の面談の資料を書かないと。

  • 帰京

    ホーホキキョ

  • 技書博11 当日

    技書博の写真を一気に振り返る。出発から戦利品の紹介まで駆け抜けます。 次回に向けた作戦会議はまた後日に。お疲れさまでした!!

  • 技書博11 前日

    技書博11の前入りで横浜に滞在している。動き始めが遅れて夜の到着になってしまった。有隣堂で本を買ってカフェで作業を済ませたのちid:kanata_02くんと合流した。 新横浜有隣堂で、からあげ先生の新刊『はじめての生成AI』買えた! pic.twitter.com/GGjQiCwzbz— daiiz@技書博け-03 (@daizplus) 2025年1月24日 横浜駅の崎陽軒食堂でシウマイを食べた。 サンマーメンも食べた。横浜発祥の料理だということを知った。就職するまでずっと神奈川に住んでいたけれど知らなかった! 最近きくらげが好きで、中華料理屋で野菜炒めをよく頼んでしまう。ここでも出会えてよ…

  • 完徹

    諸々のコードを書いていたらハイになって睡眠失敗し、翌日までの直通運転をしてしまった。早朝のコメダ珈琲でモーニングメニューを食べられたのは良かったけれど、無茶はさすがにもう厳しい年頃かもしれない。無睡大豆も卒業か。 おはようございました。トーストのほうが顔色良かった。

  • 久しぶりの自然対数

    Phonnoを理想の姿に近づけていく - #daiizメモ の補強メモです。未来の自分のための設計メモ。2025年1月バージョン。 類似度順にソート済みのsimilarImagesが与えられたとき、ちょうどいい弱さの関連度合いの画像をひとつ選定するための数式。seedImageIdsは、基本的に、試行回数tに対する増加関数。 similarImages.splice(0, skipLen); const idx = Math.floor(Math.random() * similarImages.length) const similarImage = similarImages[idx]; …

  • Phonnoを理想の姿に近づけていく

    眠さが残る火曜日 Phonno 昨日に続いて、検索画面の「Load more」ボタンの挙動を改善した。検索ボックスの内容(seed query)とほどよく関連している画像を優先して返すことで、弱い類似画像(強くない類似画像)を探すことが可能になった。継ぎ足しボタンを押すだけで遠くに連れていきたい。遠くに行きつつも、seed images, seed keywordsの遺伝子は残したい。 さらに、Load moreで気になる画像を見つけたら検索キーワード(キーイメージ)として追加できるようになった。グリッドレイアウトで整列している画像の末尾の「+」ボタンを押すだけでよい。しばらく遊んでみよう。 …

  • 技書博の準備

    今日は有給休暇。去年(訂正: 一昨年)付与されたお休みが来月期限切れになってしまうので慌てて消化している。有給休暇消滅防止委員会の活動。 MailLM 技書博のフリーペーパー(リーフレット)を推敲している。コンビニで印刷して誤字脱字のチェックも進行中。実はドッグフーディングを兼ねてMailLMに執筆の相談に乗ってもらっていた。当初の想定のような書籍にはならなかったけれど、無事に間に合いそうであることを報告してスレッドを閉じた。折衷案のリーフレットに落ち着いたのも、途中でやめずに書ききれたのもMailLMのマネージメントのおかげ。 LLMにコンテキストとして渡すメールの引用文には、メッセージの時…

  • MailLMの実験

    MailLMでは、メールインターフェースを介したLLMとの対話や、LLMによるメールマガジン生成、パーソナライズされたAIエージェントの可能性を探究しています。 Gmail UIでLLMと会話できるツール「MailLM」を作っている。できてきた!! これはgemini-2.0-flash-expと話している様子。 pic.twitter.com/eJL2Y85ej2— daiiz (@daizplus) 2025年1月18日 技書博で配布するフリーペーパーも書き始めた。本にまとめるのは難しかった!すみません!!もっと早く動き始めないといけないな。反省。4ページほどの内容にはなりそうなので、「折…

  • 今週の振り返り

    今週記事にできていなかったことを書いておく。詳細はそれぞれ別の機会に深堀りしたい。 嬉しい Perplexity検索で、自分の記事がソースとして参照されたのを目撃した。Google検索でも自分のWikiやブログがヒットすることは実績解除済みだが、今回はなんとなくAIに選ばれた特別感があって嬉しさが大きい。 PerplexityのWeb検索で自分のブログが参照されていた。世の中に貢献している感がある。 pic.twitter.com/mjqOfjsuz5— daiiz (@daizplus) 2025年1月14日 素朴でニッチな題材であってもブログや本を書いてインターネットに放流することは、LL…

  • レトロ 焼肉

    お昼に開発メンバーとレトロな喫茶店でオムカレーライス食べた。 面談、北海道のスープカレーとおでん、はてなブログとCosense最高という話をした。 LLMに負けずに人間も文字を書いていこうではありませんか! ウスターソースがついてきた。 卵にあう調味料はなんでも受け入れられる。 オムライスの卵はBFF。 ケチャップしか試したことなかったけど、この理論で醤油もマヨネーズもいけるはず。 卵より低レイヤーは仕様上は不可知。 夜はまたまた開発メンバーと一緒に焼肉した。 きょうは右手の人差し指が熱くなっただけでクリアです。 明日は本を書きます。 絶対に書きます。

  • カフェで執筆

    技書博11に向けて執筆を進めた一日だった。中途半端だった解説用のコードを仕上げて動作確認したり、脱線して別件の開発に没頭したり。原稿作成からの逃避駆動開発が捗ってしまっている。土日で勝負だ。 gishohaku.dev このカフェ好き。パンもお洒落そうだった。

  • 動画を撮る

    Phonnoの使い方や新機能を紹介する動画を撮り始めました。YouTubeに投稿していきます。第一弾は、検索箱を作って画像をアップロードする基本操作の解説です。Google Meetで画面共有して録画しただけですが、それっぽく仕上がっていてよさげです。ひとり収録を盛り上げるためにAIが合いの手を入れてくれるようになるといいですね。 Phonnoの使い方の動画を撮ってみた #Phonnohttps://t.co/sjSfdLXjPC— daiiz (@daizplus) 2025年1月14日 動画映えをよくするために、撮影を中断してUIを軽く手直したりもした。こうやって個々のコンポーネントの配置…

arrow_drop_down

ブログリーダー」を活用して、daiizさんをフォローしませんか?

ハンドル名
daiizさん
ブログタイトル
daizの日記
フォロー
daizの日記

にほんブログ村 カテゴリー一覧

商用