Kajitaka @kajitaka - Bluesky Profile

a screenshot of a Todo App made by Gemini 3.0 Pro / Gemini 3.0が作成したTodoアプリ

Gemini 3.0 ProにTodoアプリ作らせてみた。

電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。

* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き

電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。

VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。

18.11.2025 23:17 — 👍 3 🔁 0 💬 1 📌 0

A screenshot of a calculator app made by Gemini 3.0 Pro / Gemini 3.0 Proが作った電卓アプリのスクリーンショット

Gemini 3.0 Proに電卓を作らせた

ついに、Gmeini 3シリーズが出始めました

そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)

* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る

デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。

リーク通り、プログラミングの性能は高そう。

18.11.2025 23:11 — 👍 5 🔁 0 💬 0 📌 0

プログラミングにAIは必要か~AI不使用コーディング編~｜kajitaka はじめに現在、Vibe Coding(AIを使用し、ノリでコーディングする)という言葉の成立する程、コーディングにおいて、AIはなくてはならない存在となっている。 AIは、コーディングのスピードを上げるなど、良い面もある一方、悪い面もあるはずである。そこで、今回は、「プログラミングにAIは必要か」というタイトル、「AI不使用コーディング編」というサブタイトルで、記事を書こうと思った。 ...

久しぶりに、Noteを更新しました。

AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。

記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。

note.com/kajitaka1201...

16.11.2025 08:00 — 👍 6 🔁 2 💬 0 📌 0

Agentic AI Browser for Deep Search & Automation | Fellou The world's first agentic AI browser that automates web and desktop-based tasks. Providing deep search, cross-app workflow automation, images, coding and even music-all with military-grade security.

FellouというAIブラウザを試してみた。

* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在

ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。

fellou.ai

20.10.2025 08:53 — 👍 8 🔁 0 💬 0 📌 0

追加情報

Claude Sonnet 4.5、Gemini 2.5 Flash、Gemini 2.5 Proでも同じ指示で作らせた

* ClaudeはHaikuとあまり差がない印象
* Gemini Flashは、そもそもデザインが破綻するので、話にならない
* Gemini Proは、品質はトップといってもいいが、他のモデルより、格段に遅い

全体的には、速度重視なら、Claude Haiku 4.5が良さげ、性能なら、Sonnetなり、Gemini Proなりといった感じ。

16.10.2025 04:26 — 👍 3 🔁 0 💬 0 📌 0

Calculation app by Claude Haiku 4.5 / Claude Haiku 4.5が作成した電卓アプリ

Claude Haiku 4.5を使ってみた。

電卓を、"Create a calculation app."という指示のみで作らせた。

* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる

全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。

16.10.2025 04:24 — 👍 7 🔁 0 💬 1 📌 0

LM Arenaにて、Claude Sonnet 4.5(thinking)がGemini 2.5 Proを上回り、ランキングで1位になっている。

数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。

そろそろGemini 3.0が出るという噂があるので、それがどうなるか。

03.10.2025 22:39 — 👍 4 🔁 0 💬 1 📌 0

おそらくですが、無料版などで使用されるGemini 2.5 Flashというモデルが新しくなって、生成速度が速くなったことが原因だと思います。

一応、Googleによると、性能は上がっているらしいです(自分が少し使った感想や、ネットでの意見も性能は上がっていそうという感じです)。

01.10.2025 08:58 — 👍 1 🔁 0 💬 1 📌 0

一応nano bananaの補足をしておきます。。

簡単に言うと、「nano bananaとは、Googleが作成したテキストと画像の出力に対応した新しい生成AIのモデル」といった感じです。
現在は、Gemini( gemini.google.com )等で使用できます。

詳しい方向けですが、nano bananaはGemini 2.5 Flash Image PreviewのLMArenaでテストしたときのコードネームです。昔のGemini 2.0 Flash Preview Image Generationと同じ立ち位置のモデルです。

22.09.2025 09:42 — 👍 2 🔁 0 💬 0 📌 0

元写真

Gemini作成画像を一部編集

今更な感じですが、自作イラストをnano bananaでフィギュア化しました。

プロンプトはGoogleが公開しているものを使いました。

現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)

※生成AIの画像であり、販売するものではありません。

22.09.2025 09:32 — 👍 5 🔁 0 💬 1 📌 0

Comet使ってみた｜kajitaka はじめに今回は、Perplexityが開発したAIブラウザのCometを使ってみた感想をまとめたみたいと思う。あくまでも個人の意見なので、参考程度にとどめておいて下さい。 Cometについて Cometは、Perplexityの作成したAIブラウザです。以下は、Perplexity公式のComet紹介ページの文章です(英語で引用したのは、日本語ページの文章がひどいからです)。 Co...

新たにNoteを書きました。

今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。

記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。

note.com/kajitaka1201...

06.09.2025 11:45 — 👍 11 🔁 0 💬 1 📌 0

PerplexityのブラウザComet用の招待リンクです。
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。

また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。

perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...

05.09.2025 09:03 — 👍 4 🔁 0 💬 1 📌 0

Google検索のAI Modeを使ってみた(現在は英語のタスクのみ)。

* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。

精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。

26.08.2025 22:56 — 👍 4 🔁 0 💬 0 📌 0

こちらで、Gemini Diffusionを使ってやってみたら、9.9 - 9.11の計算も、大小比較も、どちらも正解しました。

日本語だと、計算は正解するが、大小比較は間違えました。

21.08.2025 10:59 — 👍 1 🔁 0 💬 0 📌 0

ちゃんと考えさせると、基本的には正解します(その場合、筆算みたいなものを書いてやっていることが多い気がします)。

一方、推論をせずに、速く生成される時に、間違えることがあるといった感じです。
(個人の推測ですが、ただの引き算の計算だから、推論はそこまで必要ないという結論に至っているのだと思います)

09.08.2025 09:44 — 👍 1 🔁 0 💬 0 📌 0

GPT-5や他のモデルもですが、9.9 - 9.11でも、正解するときもあります。

9.90 - 9.11だと、LMArenaでやった感じは、正解率は上がっている気がします(というか、ほぼ全てのモデルが正解します)。

09.08.2025 09:40 — 👍 1 🔁 0 💬 0 📌 0

一応、GPT-5もGmeini 2.5 Proも間違っていることを指摘すれば、正しい0.79という答えにはたどり着いた。

08.08.2025 11:50 — 👍 7 🔁 0 💬 0 📌 1

似たことを、やってみた。
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。

ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。

LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。

9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...

08.08.2025 11:34 — 👍 6 🔁 0 💬 2 📌 1

AI電卓ベンチマーク(v1)｜kajitaka はじめに前にも記事にしたことがある、AIに電卓を作らせることによって、AIのプログラミング能力を測るベンチマーク(的なもの)を明文化してまとめようと思う。その後、自分が使えるモデルがどれくらいの得点になるのかを書こうと思う。概要上でも書いたように、このベンチマークはAIに機能を指定した上で電卓を作らせ、AIのプログラミング能力を測るものである。基本は前のNote記事で、プロンプト...

Noteを書きました。
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。

最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。

note.com/kajitaka1201...

07.08.2025 23:47 — 👍 2 🔁 0 💬 0 📌 0

a screenshot of leaderboard of LMArena. GPT-5 is at the top, followedby Gemini 2.5 Pro

a screen shot of win rate table in LMArena. GPT-5 is at the top, but loses to Gemini 2.5 Pro in head-to-head battles

GPT-5が発表されて、LMArenaでトップになっているものの(画像1つ目)、Gemini 2.5 Proとの直接対戦では、勝った割合が0.33とGemini 2.5 Proに負けている(画像2枚目)。

07.08.2025 21:06 — 👍 4 🔁 1 💬 0 📌 0

Microsoftはこういうところありますよ。

ユーザー数増えるどころか、イメージが悪くなり、余計減りそうな感じがするんですが、どうなんでしょうね。

一応、CopilotはChatGPTに入っているモデルと同じなので、無料でもChatGPTでは有料のモデルが使えたりする、良いサービスのはずなのに。

04.08.2025 08:03 — 👍 0 🔁 0 💬 0 📌 0

Horizon Beta - API, Providers, Stats This is a cloaked model provided to the community to gather feedback. This is an improved version of [Horizon Alpha](/openrouter/horizon-alpha) Note: It’s free to use during this testing period, and ...

ネットでGPT-5などと噂されているHorizon Alpha(現在はアップデート版のHorizon Betaが公開されていてそちらが使用可能)を使ってみた。

* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解

スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。

Horizon BetaはOpen Routerで利用可能です。

03.08.2025 10:12 — 👍 3 🔁 0 💬 0 📌 0

楽天AI 使ってみた｜kajitaka はじめに今回は、「Rakuten AI OPTIMISM」に行ってきた際、初めて使ってみたため、それを記事にしようと思う。そもそも楽天AIとは楽天AIとは、名前の通り、楽天が開発するAIであり、最近、ショッピングなど楽天グループに関連するエージェント機能を追加した。現在は、ベータ版で公開されていて、楽天のサイトの「今すぐベータ版に参加する」ボタンから利用することができる。 ※注意...

Noteを公開しました。
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。

note.com/kajitaka1201...

31.07.2025 11:13 — 👍 5 🔁 0 💬 0 📌 0

個人的なつぶやき

ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。

最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。

18.07.2025 11:30 — 👍 7 🔁 0 💬 0 📌 0

自分も色々なモデルが使えるのは、便利だと思います。
ただ、個人的には、全員が全てのモデルの得意不得意を理解しているとは思い難く、その様なことを教えない限り、結局は初期設定のもので使われるといったことが起きそうな感じがします。

もちろん、それらを教えた場合には、1つのモデルや1社のモデルしか使えないのと比べて圧倒的に便利になるのはそうなのですが。

25.06.2025 10:10 — 👍 0 🔁 0 💬 1 📌 0

自分のAI使用法(プログラミングにおいて)｜kajitaka はじめに今回は、現段階で自分がプログラミングをするのに当たって、自分がどのようにAIを使用しているのかについて、書いてみたいと思う。前提いつも作っているもの自分は、Next.jsを使用し、ウェブアプリを作成している。言語としては、Typescriptを主軸に、ライブラリがNext.jsやtailwind cssなどを使用している。 firebaseなどの外部ツールなどを使用する...

Noteを公開しました。
自分のプログラミングにおいてのAIの使用法について書いてみました。
よろしければ、この投稿かNoteのどちらかで各々のAIの使い方についての意見を書いていただけれると、嬉しいです。

note.com/kajitaka1201...

22.06.2025 09:31 — 👍 11 🔁 0 💬 1 📌 0

Gemini 2.5 Flash Lite Preview 06-17が作成した電卓のスクリーンショット。0で割ったときのエラーが表示されている。 / a screenshot of a calculator made by Gemini 2.5 Flash Lite Preview 06-17. the error when divinding by 0 is displayed.

Gemini 2.5 Flash Liteに電卓作らせてみた。

プロンプトは前のNoteのものです。

得点は20点満点中18点だった。

* デザインが、若干ボタンの間などが分かりづらい。
* エラーが表示される方法が、今までにない方法で、また、個人的に気に入った(画像の通り)
* thinkingもないため、13.1sで完成した(めちゃくちゃ速い)。

全体としては、thinkingがなくても、それなりにプログラミングの能力があり、ちょっとしたことなら、直ぐに完成するので、役に立ちそう。

18.06.2025 10:52 — 👍 6 🔁 0 💬 0 📌 0

Gemini 2.5 Flashが作成した電卓アプリのスクリーンショット / a screenshot of a calculator made by Gemini 2.5 Flash

Gemini 2.5 Flashの正式版に電卓作らせてみた。

プロンプトは前のNoteのやつです。

得点付けをすると、20点満点中17点。

* デザインは結構特殊だが、文字も見やすいし、何をホバーしているのかなどが分かりやすい。
* スピードは、Proよりは速いが、thinkingをオンにしているため、1分ほどかかる。

プレビューの時と同じく、それなりのプログラミング能力はありそう。
それなりに簡単なタスクで、Proほどの時間をかけたくないときには便利になりそう。

18.06.2025 10:41 — 👍 2 🔁 0 💬 0 📌 0

Gemini 2.5 Proが作成した電卓のスクリーンショット / a screenshot of a calculator made by Gemini 2.5 Pro

Gemini 2.5 Proの正式版で電卓タスクをやってみた。

プロンプトは前のNoteと同じもの。

Noteと同じ評価(プラスの得点なし)をすると、20点満点中19点。

* デザインが見たことのないもので、最新っぽい感じではないが、背景色と文字とのコントラストがちゃんと合って、文字が見えやすくなっている
* スピードは、thinkingで相当考えていることもあり、結構かかる(スピード重視用ではないのはプレビューと同じく)。

インターネットの意見を見ても、前のバージョンと大きな変化はないそうで、少し変更を加えて、正式版にしたといった感じだと思われる。

18.06.2025 10:23 — 👍 2 🔁 0 💬 0 📌 0

Gemini 2.5 Flash Liteのプレビューが出ていたので、使ってみた。

速度はtokens per secondが266.3だったりする時もあり、相当速い。(比較対象：Flash実測値170.5)
日本語は若干表現がおかしいところが存在する。

よって、flash liteは、精度はあまり気にしないが、速度が重要というタスクにおいて、使うのが良さそう。

18.06.2025 10:12 — 👍 0 🔁 0 💬 0 📌 0

Kajitaka

Latest posts by kajitaka.bsky.social on Bluesky

@kajitaka is following 19 prominent accounts