chevron_left

メインカテゴリーを選択しなおす

cancel
arrow_drop_down
  • 年度末

    今月は安定してコードを書けた。 お疲れさまでした! 千疋屋 苺のムース

  • 日曜日

    京都に帰ってきた。 新横浜駅にて。 京都駅にて。八条東口から出たほうが地下鉄への乗り換えは便利なのだけど、雰囲気が明るいこっち側を使いがち。 日常の何気ない瞬間を積極的に写真に残していきたい。

  • 土曜日

    南町田グランベリーパーク

  • 金曜日

    来月上旬の Helpfeel Tech Conf 2025 での登壇に向けて散髪してきた。髪型がより自然な雰囲気になるために2週間のバッファを設けている。そろそろ発表資料を書かないと! 発表資料を書いていこう! https://t.co/78cMqj6Rfv— daiiz (@daizplus) 2025年3月28日 帰りにベローチェでドライカレーを食べた。 本日の京都タワー。標準カラーでのライトアップの姿。 昨晩はAIと会話して夜更かししてしまったので今日は早く寝たい。

  • Claude DesktopでMCPサーバーに入門した

    Claude DesktopでModel Context Protocol (MCP) サーバーを接続し、ローカルファイルを操作できるようになった。自分の関心領域としてMCPの世界にどれだけ深入りするかはまだ分からないものの、漠然と苦手意識を持ちたくない、かつ、議論にはついていきたいので人並みに触っていきたい。思いがけないアイデアを閃く可能性にも期待している。今日のところは @modelcontextprotocol/server-filesystem を使ってチャットログを書き出したり、超小規模なRAGみたいなことができた。次はこれの実装を読んでオリジナルなサーバーを書きたい。 タスクバーに…

  • 算数

    Duolingoで数学(まだ算数レベル)をやっている。50日続いた。四則演算の表現方法がなんか独特な世界観で面白い。ブロックを5, 10区切りで数える癖をつけさせようとしている感じがする。例えば正解が「27」になる問題では、でかい塊が2つあって半端なブロックが2個転がっているやつを選べばいい。視覚的に即答できるようになってくる。 答えをズバリ数字として入力するだけでなく、数直線上でスライダーを動かして答える問題も多い。おかげで四分の一の場所をピンポイントで選ぶのがうまくなった。 このゆるい世界観でどこまで難しい問題に挑めるのか、不安を抱きつつも続けてみる。いまのところは文章題の英語の理解の方が…

  • life.txt

    実世界で見聞きしたもの、食べたもの、体験したこと、考えたことを全部LLMのコンテキストに載せたい。人生を記述して、対話を可能にし、自律的に新しい作品を生み出すための技術を探究していこう。プロジェクト life.txt、ここに始動。 Long ≪ Life context

  • 月曜日

    カレー、タイ米、月曜日

  • Phonno: PDF画像のページ送りに対応

    PDF画像のページ送りに対応した。Phonnoでは、PDFファイルがアップロードされたとき、各ページを画像に分割して保存している。この際にページ画像の順序を保持しているため、前後のページに移動できる。データ構造的には独自のドキュメントビューワを作るための下準備が整っている。あとは時間をみつけてイケているUIを書いていきたい。 気の向くままに検索してもっともらしい画像に着地したのち、周辺ページを読み進めて前提知識や関連情報を獲得できる。 移動時のガタツキもなるべく早くなんとかします。

  • 急に暑くなった! 22度!?— daiiz (@daizplus) 2025年3月22日 洗濯が捗ったのはよかったけれど、とにかく目が痒い!!

  • 祝日の翌日

    NotebookLMにマインドマップ機能が追加されていた。 Phonnoで研究開発中の思考フローチャート生成も負けていられないな! daiiz.hatenablog.com グーグルに先駆けて似たものを出せていたのは先見の明がある感じがしてなんか嬉しい。

  • 祝日

    まだまだ寒い。花粉症で頭の回転が悪いなりにコードを書きまくった一日だった。焼きそばを食べて寝よう。

  • Geminiに改行爆弾を送り込まれることがあって困っている。 結構な頻度でGeminiに改行爆弾を送り込まれることがあって困っている pic.twitter.com/8vy1IiwpqU— daiiz (@daizplus) 2025年3月19日 pic.twitter.com/dJNtxCJD4n— daiiz (@daizplus) 2025年3月11日 こちらは-1爆弾。 pic.twitter.com/bEQq5YhMKM— daiiz (@daizplus) 2025年2月26日 出力トークン長をめいっぱい使って送ってくるので待ち時間も長くなる。この文字列が課金されるのも気に食わない…

  • 🌏️🔌

    自宅のWi-Fiルーターが壊れてしまった。本日は有線接続でお送りします。 持っててよかったEthernet to USB-C変換ケーブル。

  • Artifact Registry移行の駆け込み対応

    個人開発で運用している複数のGCPプロジェクトで警告が出ていた。いよいよ期限が迫っているので着手。ドキュメントを読みつつ提示されたコマンドを実行するだけで無事に移行できた。新たな環境での権限付与のレビューだけ大変だった。Container Registryに保存されていたDocker imageが全部コピーされて時間がかかった。もはや参照されていない古いやつは予め消しておけばよかった。2022年の懐かしいimageも出てきた。 対応完了した。「今日の日付」画像、点描画変換ツール、miilClient、Phonno、Chronicle、Snapshot machineなどがすべて救われた。めでた…

  • 湘南藤沢 3

    午前中は開発の議論をして、午後は鎌倉でフレンチイタリアンをいただいた。 小学校の遠足ぶりの小町通り ブイヤベース、牡蠣、セロリの新芽 サーモン、バジル、マンゴーソース。クラスタリングの可視化を思い出した。 daiiz.hatenablog.com daiiz.hatenablog.com 鯖、マンゴー、カリフラワーソース モチモチ食感のパスタ、猪肉のラグー。猪肉のRAG。この料理と一緒に出されたワインが好きだった。写真を撮り忘れた。 めっちゃ美味しい豚肉 2種類のチョコレート

  • 湘南藤沢 2

    夕方まで爆睡したあと、藤沢で id:kanata_02くんとディナーしてきた。技術書典18に無事当選できたので出展の作戦会議をはじめた。TeamJとしての初の現地参戦*1を最大限に楽しめるよう、なんとしても新刊を書きたい。執筆スケジュールを綿密に組もう。他にも万博やWWDC、Mac miniの話もできてよかった。 写真を正方形で撮る(あとから切り抜くするのではなく最初から正方形で保存する)話を聞いて、試してみた。普段と構図の決め方が変わってきて難しい。まったく関係ないのに無意識にスマホの向きを変えたりしていた。言われてみればたしかにmiilやInstagramに投稿することを考えると長方形で撮…

  • 湘南藤沢

    今週末は藤沢〜鎌倉エリアに滞在予定。慶應義塾湘南藤沢キャンパスで開催された増井先生の最終講義に出席してきた。 京都に帰ったら改めてレポートを書きたい。 聴講者による最終講義の実況: https://x.com/hashtag/masui_last_lecture?src=hashtag_click

  • Geminiの画像編集能力に感動した

    3ヶ月ぶりにGeminiに感動した。前回の感動はこちら: daiiz.hatenablog.com 今回もGoogle AI Studioでのできごと。アップロードした画像をテキストで編集できるようになった。加工したい内容をプロンプトで指示するだけで画像を生成してくれる。指示と関係ない箇所はほとんど変更されない。これがすごい。 Google AI StudioでのImage Editingのデモ。クロワッサンにチョコソースをかけるよう指示している。 ここまで綺麗に画像の大部分を維持して望み通りの編集をしてくれるツールは初めて見た。素人ユーザーとしてはPhotoshopでも難しかったと思う。 ほ…

  • ハッピーセット

    マクドナルドのハッピーセットで、チキンナゲットのおもちゃをゲットした。 ハッピーセットのチキンナゲットのおもちゃゲットした pic.twitter.com/iT2Jx2KnOI— daiiz (@daizplus) 2025年3月12日 自作のナゲット形状分類器にもかけてみる。全体的に丸みが強いせいで判別に苦戦していた。これまでの実験では、本物のナゲットに対しては、RGBフルカラー写真で学習したモデルで最もよい結果が得られる傾向があった。しかし今回のおもちゃを対象にしたときは、輪郭線画像データで学習したモデルが安定していた。また、いずれのケースにおいても二値化画像(白黒画像)のモデルはほとんど…

  • Phonno: PDFファイルに対応

    PDF文書の入力に対応しました。ファイルを選択するだけで、全ページが自動で画像化されてPhonnoに取り込まれます。 つぎは、対象の題材をとことん読んで理解するための支援機能を作りたい。せっかくLLMという最強の武器を手に入れたのだから、概要を雰囲気で把握するのではなくて、完全に納得できるまで寄り添ってくれる文書・画像ビューワを目指したいところです。超検索型ドキュメントビューワ。

  • ハニーとマスタード

    マクドナルド、モスバーガー、ケンタッキーをだいたい攻略したので、次はロッテリアに進出していきたい。ハニーマスタード チキンフィレバーガーを食べた。美味しい。フライドポテトも好みのタイプでいい感じだった。 撮影: Pixel 6a、加工: Foodie

  • ネムスギルのスギの部分

    春の服を見てきた。とは言ってもまだ急に寒くなったりするので油断はできない。冬のコートをクリーニングに出すのももう少し待ったほうがいいかもしれない。 花粉症のせいでものすごく眠くて、思考力がGPT-3.5 Turboくらいになっている。体調が万全でないときは深く考えないほうがいい。これまでの経験でようやくわかってきたけれど、ここでなんとか力を振り絞って複雑なことをやったとしても、後からほとんどやり直す羽目になる。さほど頭を使わなくても淡々とこなせることだけをやって、あとは寝ておくに限る。 こんな状況でもWhiskは楽しめる。 daiiz.hatenablog.com https://x.com/…

  • Phonno: 画像リストのレイアウトシフトを軽減

    検索画面の画像リストのSkeleton loadingを実装した。これまでは画像リストの初期高さが0pxであったため、画像の読み込み完了前後でガタツキ(レイアウトシフト)が大きかった。全体的にだいぶ良くなった。あとは説明文とキーワードサジェスト領域も同じように対応できたら完璧だ。 Chrome Dev Toolsで Slow 4G 回線をシミュレーションした様子。 おまけ 個人開発のGitHubリポジトリにGemini Code Assistをインストールおり、AIにコードレビューに参戦してもらっている。自動生成されるPull Requestのサマリーで英語を勉強できる。今日は jarring…

  • 相棒 123%

    外出時に持ち歩いているメモ帳。コンビニで売っているやつ。ふと思いついたアイデアを書き留める。大事なページはコピーして自宅のフォルダで保管する。見開きでコピーするとき、B5紙面に収まるように拡大するには 123% (ほぼA5 -> B5) を指定すればいい。語呂が良くて覚えやすい。コピーを終えたらページをミシン目で切り取って破棄する。街中で落としても安心! www.kokuyo-st.co.jp カットオフノート5号(A6)中横罫48枚 ● 必要なページだけをきれいに切り離せる、ミシン目入りのカットオフタイプ。 ● 特殊フィルムでラミネート加工したクロスを採用。背が破れにくいだけでなく、ボールペ…

  • バターとメープルシロップ

    京都駅のカフェでパンケーキを食べた。 AIがコードを書いてくれるようになったら、パンケーキとハンバーガーを巡る旅をしたい。

  • Phonno: キーワードの概要パネルにも思考チャートを表示する

    表題の通り、キーワードの解説が生成されるパネルに、関連用語や関連概念を示すフローチャートが表示されるようになりました。Ask the Flow機能の発展形です。現状ではリアルタイムで生成するため少々時間がかかりますが、生成結果の保存と再利用の仕組みを(AIが)実装中なのでそのうち爆速になります。 Bigtableに関する知識整理の例 daiiz WikiでのChatGPTに関する説明の例(デモ) その他のアップデート 画像配信: 大量のサムネイル画像が読み込まれる検索画面が安定しました。初期描画完了までの時間が短縮されます。Cloudflare R2オブジェクトのPresigned URLを作…

  • クラッカー レーズンバター

    大学時代からの友人が久しぶりに京都に来たので飲んできた。僕が大学院を中退して地元から引っ越したりといろいろあったけれど、知り合って12年経ったいまでも、こうして定期的に会って盛り上がれるのは本当にありがたい。 daiiz.hatenablog.com

  • PosterLM構想(下調べ編)

    花粉症で目が痒くて文字を読むのがしんどい。Deep Researchの長文レポートをポスター形式でまとめて一撃で概要を把握したい。ウェブUIから o3-mini-high、Claude 3.7 Sonnet、Gemini 2.0 Flash Thinking を試してみた。自分でロジックを組む前に、何事もまずはAIの実力に任せてみて課題を探るのがいい。ということで情報の取捨選択からレイアウトまでやってもらう。プロンプトを調整すればもっといいものが出るだろうが、今後の開発戦略を考えるためのベースラインということで。 入力内容 Deep Researchの結果(Markdown形式のテキスト) プ…

  • 海鮮丼

    トンカツを食べようと思って出掛けたが、お店を間違えて海鮮丼になった。

  • Phonno: 思考フローを生成する機能を一般開放

    Phonnoでの思考フロー生成(Ask the Flow)機能が誰でも使えるようになりました🎉 検索画面と画像プレビュー画面でフローチャートを生成できます。 API料金の都合でこれまではログインしているユーザーのみに開放していましたが、今日からはログイン状況に関わらず利用できます。ボックスの編集者だけでなく、検索専用ビューの利用者にも触ってもらえるので嬉しいです! GPT-4o, o3-mini, Claude 3.5 Sonnet と試してきましたが、精度はそこそこ満足できても料金や速度面で課題が残っていました。先日 Gemini 2.0 Flash が一般提供開始されたことで選択肢が増え、…

arrow_drop_down

ブログリーダー」を活用して、daiizさんをフォローしませんか?

ハンドル名
daiizさん
ブログタイトル
daizの日記
フォロー
daizの日記

にほんブログ村 カテゴリー一覧

商用