Kajitaka's Avatar

Kajitaka

@kajitaka.bsky.social

プログラミング、AI系が趣味の日本人です。 I'm Japanese. I'm interested in programming and AI. Github: https://github.com/kajitaka1201 Note: https://note.com/kajitaka1201

148 Followers  |  79 Following  |  172 Posts  |  Joined: 24.11.2024
Posts Following

Posts by Kajitaka (@kajitaka.bsky.social)

An image generated by Nano Banana 2(Gemini 3.1 Flash Image Preview).
Prompt: "円周率が3.05より大きいことを証明している黒板の画像。"

An image generated by Nano Banana 2(Gemini 3.1 Flash Image Preview). Prompt: "円周率が3.05より大きいことを証明している黒板の画像。"

Nano Banana 2を試す

2003年の東大の数学の問題の、「円周率が3.05より大きいことを証明せよ。」を解説する黒板の画像を作らせた

* 左側の図におけるSの位置や直角の記号などは間違っている
* 証明の8における、近似値を当てはめるというのは、少し危ない気がする

図を含むようになってくると、出来ない部分が出てきた
証明部分に関しては、画像生成のモデルというより、基盤モデルの問題な気がする

少し問題があるが、もうこのレベルまでできるのには驚いた

27.02.2026 11:43 — 👍 7    🔁 1    💬 0    📌 0
An image generaged by Nano Banana 2(Gemini 3.1 Flash Image Preview).
Prompt: "2次方程式の解の公式を証明している黒板の画像。"

An image generaged by Nano Banana 2(Gemini 3.1 Flash Image Preview). Prompt: "2次方程式の解の公式を証明している黒板の画像。"

An image generated by Nano Banana 2(Gemini 3.1 Flash Image Preview).
Prompt: "Generate an image of a blackboard proving the formula for solving a quadratic equation."

An image generated by Nano Banana 2(Gemini 3.1 Flash Image Preview). Prompt: "Generate an image of a blackboard proving the formula for solving a quadratic equation."

Nano Banana 2を試してみる

解の公式を証明する黒板の画像を生成させた

日本語で指示した際には、式が重複していたり、一部の記号が間違っていたりした
英語の場合は式などに問題はなかった

解の公式だと、証明を適切に画像にできるっぽい
もっと難しいのを試してみる

27.02.2026 11:33 — 👍 2    🔁 1    💬 0    📌 0
An image that explains how ai works. Generated by Nano Banana 2.

Prompt: Create an image that explains how ai works.

An image that explains how ai works. Generated by Nano Banana 2. Prompt: Create an image that explains how ai works.

An image that explains how ai works in Japanese. Generated by Nano Banana 2.

An image that explains how ai works in Japanese. Generated by Nano Banana 2.

Nano Banana 2を使ってみた。

AIの仕組みを解説する画像を作らせた。
今までに試したなかでは、一番まともな説明になっている。

英語で生成させたから、日本語に翻訳させたバージョンも作らせた。
一部変な部分もあるが、読めて理解できるレベル。

Flashがベースで、この性能は相当すごいのでは。

26.02.2026 22:46 — 👍 3    🔁 0    💬 1    📌 0
Preview
Lyria 3は音楽版Nano Bananaとなり得るか|kajitaka はじめに 2月18日、Google DeepMindは、音楽生成AI、Lyria 3及び、Geminiアプリへの統合を発表しました。 A new way to express yourself: Gemini can now create music Lyria 3 is now available in the Gemini app. Create custom, hi blo...

Noteを書きました。

最近Geminiに統合されたLyria 3についてです。

note.com/kajitaka1201...

22.02.2026 11:21 — 👍 2    🔁 0    💬 0    📌 0
a screenshot of Japanese Writing Paper Preview App made by Gemini 3.1 Pro

a screenshot of Japanese Writing Paper Preview App made by Gemini 3.1 Pro

Post image

Gemini 3.1 Proに、原稿用紙のプレビューアプリを作らせた。

* 電卓の時よりも思考時間が長め
* 大きな問題はない
* 文末の句読点は、その行の下に描画される
* かぎ括弧閉じと読点が1つのマスに入っていない
* ダウンロードすると、壊れた原稿用紙が出てくる

そもそも、原稿用紙のルールを知らないと出来ないし、知っていても実装はそれなりに難しいと思っていたので、大きなミスがなく、実装できたのには驚いた。
もう、これくらいのレベルなら、人間が関与しなくてもできるっぽい。

他のAIにもこれをやってみて、比べてみる。

20.02.2026 11:53 — 👍 6    🔁 0    💬 0    📌 0
a screenshot of calculation app made by Gemini 3.1 Pro

a screenshot of calculation app made by Gemini 3.1 Pro

Gemini 3.1 Proに電卓を作らせてみた

AI Studioで「電卓アプリを作って。」というプロンプト

* スピードは早くもなく遅くもない
* デザインに問題はない
* 0除算ではInifinityと表示される
* 浮動小数点数計算には対応しているものの、小さい数同士の掛け算が0となる
* キーボードショートカット非対応

他のモデルとは違い、言われたことはやるけど、言われていないことは実装しないというスタンス
もうこのレベルのタスクなら、本来のコーディング能力が測れてないので、何とも言えない。

他のタスクをやらせてみるつもり。

20.02.2026 11:39 — 👍 3    🔁 0    💬 0    📌 0
Video thumbnail

Geminiに統合されたLyria 3での楽曲生成2回目

プロンプト:「日本語の曲 伴奏はピアノのみ ボーカルは透き通った高めの女性の声」

ダウンロード時の名前が、Echoes of Your Smile

日本語中心の歌詞の中に英語が入っていても、いい感じにつなげている

30秒という秒数できれいに終わっている

19.02.2026 11:43 — 👍 4    🔁 0    💬 0    📌 0

最近の音楽生成AIを触らないので、あまり性能の比較はできないのですが、品質自体は良さげな印象です

歌詞を書かなくてもそれなりに良いものができるというのが結構強みな気がしてます

それこそ、YouTubeのショート動画とかのBGMとかとしてなら、30秒でも良いのかもしれません

19.02.2026 11:39 — 👍 1    🔁 0    💬 1    📌 0

自分にとって、Grokは、ChatGPTとかGeminiとかの競合というよりも、Xに搭載されているAIという印象が強いです

Grok Code Fast 1なるモデルも存在したりはするのですが、やっぱり、ClaudeとかCodexとかのモデルと比べると、あまりパットしないという感じがします

19.02.2026 11:36 — 👍 1    🔁 0    💬 0    📌 0
Video thumbnail

Geminiに統合されたLyria 3で音楽を生成してみた。

プロンプト:「伴奏がピアノだけの美しい日本語の歌 切ない感じ」

プロンプトには正確に従っている。
息継ぎとかはあるけど、まだAIだと分かるレベル。
自動で歌詞を考えてくれて、それで音楽ができるというのは便利。
30秒までしか出来ないから、ちゃんとした音楽を作るのは難しそう。

Google I/Oの日付が発表されたタイミングで、I/Oで、音楽生成とかも出るのかなと思っていた時期だったので、驚いた。

19.02.2026 11:22 — 👍 2    🔁 0    💬 1    📌 0
a screenshot of calculation app made by Grok 4.20(Beta)

a screenshot of calculation app made by Grok 4.20(Beta)

Grok 4.20(Beta)に電卓を作らせた。

* スピードは、速くもなく遅くもない
* 他のAIに比べ、デザインは劣る
* 0除算ではInfinityと出る(対策していない)
* 小さい数同士の掛け算では、0となる(その分少数同士の加減は問題ない)

コーディング能力は、Claudeとかと比べると、若干劣っていそう。
あと、4人のエキスパートなる謎の機能があって、4つのAgentが話しているような感じで、Thinkingをしている。
結果としては、ほとんど全員が同じことを復唱しているだけになっているので、あまり意味は感じない。

19.02.2026 11:02 — 👍 4    🔁 0    💬 1    📌 0
a screenshot of calculation app made by Claude Sonnet 4.6

a screenshot of calculation app made by Claude Sonnet 4.6

Claude Sonnet 4.6で電卓を作らせてみた。

Arenaで、「電卓アプリを作って」という指示で作らせた。

* 速度は速い
* 基本的な機能に問題はない
* 0除算の際は正常にエラーと表示される
* 小さい数同士の掛け算では、なぜか1となる
* 0のボタンの文字の場所が少し気になる

完璧ではないが、一応問題ないレベルのものが、すごいスピードで完成した。
Claude Sonnet 4.6は、Opusほどの性能は必要ないが、速度が重視したい場合には便利だと思われる。

18.02.2026 11:01 — 👍 4    🔁 0    💬 0    📌 0
Preview
ChatGPTからClaude Opus 4.6まで|kajitaka はじめに 2022年11月に、ChatGPTが登場して以来、数多くのAIが多くの企業から発表されてきました。 今回は、そのAIの来歴についてまとめてみようと思います。 全てのモデルを列挙すると大変なので、大きな変化が生まれたところを中心に取り扱います。 年度でまとめたうえで、時系列順に並べています。 上の目次等を使用し、見たいところだけでも、見ていってください。 2022年 Chat...

Noteを書きました。

内容は、AIの来歴についてです。
ChatGPTの登場から、Claude Opus 4.6くらいの時代のことをまとめています。

note.com/kajitaka1201...

15.02.2026 09:47 — 👍 4    🔁 1    💬 1    📌 0
Preview
ソブリンAIの将来|kajitaka はじめに 今や、AIは我々の生活に入り込んできています。 しかし、これらのAIのほとんどは、海外(多くはアメリカ)で開発されています。 海外で開発されたAIが普及する中で、セキュリティーやプライバシー、倫理観等の問題が発生しています。 そこで、注目されているのが、ソブリンAI(主権AI)です。 今回は、ソブリンAIとは何なのかについて触れた後で、その将来について考えてみます。 ソブリン...

Noteを書きました。

ソブリンAI(主権AI)の将来についてです。

note.com/kajitaka1201...

11.02.2026 02:49 — 👍 2    🔁 0    💬 0    📌 0
a calculation app made by claude opus 4.6 without thinking

a calculation app made by claude opus 4.6 without thinking

a calculation app made by claude opus 4.6 with thining

a calculation app made by claude opus 4.6 with thining

Claude Opus 4.6が出ていたので、電卓作らせた

プロンプトは、「電卓アプリを作って。」のみ
Arenaで、thinkingあり、なしの両方をテストした

thinkingなし(画像1枚目):
* 普通に使える
* キーボードショートカットにも対応
* 0除算と浮動小数点数に正確に対応

thinkingあり(画像2枚目):
* 普通に使える
* キーボードショートカットにも対応
* 0除算にも対応
* 浮動小数点数は、小さい値同士の掛け算で0になってしまう

電卓のタスクが、現在のAIに簡単すぎて、thinkingあり、なしの差が良く分からない
スピードは、早く、性能も問題ない

06.02.2026 10:40 — 👍 5    🔁 0    💬 0    📌 0

ありがとうございます。

01.02.2026 10:40 — 👍 1    🔁 0    💬 0    📌 0
Preview
2026年のAI業界|kajitaka はじめに 2026年が始まり、1ヶ月が過ぎ、早くも2月となりました。 その1ヶ月においても、AI業界では、様々なニュースがありました。 共通テストで、GPT-5.2 Thinkingが、16科目中9科目で満点をとる AppleがGoogleのGeminiを使用し、Siriを開発することを発表 CES 2026(NVIDIAのVera Rubin等の発表) Open AI...

Noteを書きました。

2026年のAI業界について、予想をまとめました。

note.com/kajitaka1201...

01.02.2026 10:07 — 👍 3    🔁 0    💬 0    📌 1

他企業と比べて、安全性に重きを置く2企業のトップとだけあって、危険性だったり、雇用の話だったりの意見がしっかりしています。

個人的な意見が近いので、見ていて(聞いていて)、共感する部分が多かったです。

23.01.2026 09:49 — 👍 2    🔁 0    💬 0    📌 0
The Day After AGI
YouTube video by World Economic Forum The Day After AGI

21日に行われた、The Day After AGIというトークショー(?)が面白かったので、共有します。

World Economic Forum 2026というイベントで行われて、Google DeepmindのDemis Hassabis氏と、AnthropicのDario Amodei氏が話しています。

司会の人の質問が良くて、それぞれの意見が上手く出ています。

タイトルは、The Day After AGIですが、AGIの到達までの話が主です。

youtu.be/mmKAnHz36v0

23.01.2026 09:47 — 👍 2    🔁 0    💬 1    📌 0
Preview
Xの騒動とAIに関する問題への見解|kajitaka はじめに 現在、Xにおいて「画像を編集」の機能が波紋を広げています。 この機能のついて、個人的な感想について、書いてみます。 その後、Xの騒動の話を広げて、AIに関して起きている議論と個人的な意見についても扱います。 背景説明 まず、背景説明をします。 2025年12月、Xにおいて、「画像を編集」という機能が追加されました。 その機能とは、Xで投稿された画像上に表示される「画像を編集」...

Noteを書きました。

去年の12月から問題になっているXの画像編集機能についての感想についてです。
また、話を広げて、生成AI関連の問題に関しての自分の見解も書いています。

感想や、個人の意見等をコメントしていただけると幸いです。

note.com/kajitaka1201...

18.01.2026 11:14 — 👍 5    🔁 0    💬 0    📌 0

記事内にもある通り、このBlueskyアカウントでは、AI系だけでなく、プログラミングについても扱ってみたいと思っています。

元々、Next.jsを使用していたのですが、最近、他のフレームワークを試しているので、そこらへんの感想を少し投稿するかもしれません。

12.01.2026 11:33 — 👍 3    🔁 0    💬 0    📌 0
Preview
2026年の目標|kajitaka 新年の挨拶 遅くなりましたが、新年あけましておめでとうございます。 今年の目標 今年1本目の記事ということで、新年の抱負として、NoteやBlueskyでの活動についての目標を書いてみたいと思います。 Noteの目標 昨年(2025年)は、Noteを始めた年でもあり、不定期に記事を書いていました。 これを受けて、今年はできるだけ定期的に記事を書けるように、週1本を目標に記事を書いていき...

今年初のNoteを書きました。

新年ということで、今年の目標を書いてみました。

note.com/kajitaka1201...

12.01.2026 11:32 — 👍 6    🔁 0    💬 1    📌 0

ありがとうございます。

01.01.2026 09:21 — 👍 1    🔁 0    💬 0    📌 0
Preview
ぶるーすかいおみくじ | Bluesky Blueskyアカウントでおみくじが引けます(毎年結果が変わります)

ぶるーすかいおみくじの結果は「吉」でした。
#ぶるーすかいおみくじ
oracle.heion.net?handle=kajit...

31.12.2025 21:31 — 👍 2    🔁 0    💬 0    📌 0

あけましておめでとうございます。
今年もよろしくお願いします。

去年は、Noteを書き始めたり、このアカウントも本格的に動かし始めたりなど、自分にとっては始まりの年でした。

今年は、去年の様に、AIやプログラミングのことを投稿したりすると思います。
2度目ですが、去年はありがとうございました、そして今年もよろしくお願いします。

31.12.2025 15:00 — 👍 7    🔁 0    💬 1    📌 0
Preview
GPT Image 1.5 使ってみた|kajitaka はじめに アメリカ時間で、12月16日、OpenAIから、GPT Image 1.5が発表されました。 そこで、今回は、今までトップと言われていたNano Banana Pro(Gemini 3 Pro Image Preview)との比較を中心に、GPT Image 1.5の使ってみたところの感想をまとめます。 この記事は、自分のBlueskyのポストを中心に書いています。 そのため、そち...

Noteを書きました。

このアカウントでも、数回扱ったGPT Image 1.5についてです。

note.com/kajitaka1201...

17.12.2025 03:58 — 👍 6    🔁 0    💬 0    📌 0
Preview
Nano Banana Proのプロンプトのコツ︰仕事や創作で実際に何ができる?【Gemini 3 / 画像生成AI / 初心者向け / AIイラスト / デザイン / 業務効率化】|Alpaka Nano Banana Proって話題だけれど、何に強みがあって、どうやって使ったら上手くいくのか分からない、とか思ったりしますよね。 私も、前のバージョンのNano Bananaのときは、画像のスタイル変更や編集能力は高いから使い道がありそうと思いつつも、日本語が破綻したり、プロンプトを工夫しても思った通りの画像にならなくて、正直持て余し気味だったんですよね。 それに対して、Nano ...

他のもやってみたが、表としてそれなりに読めて、数値も正しいのは、Nano Banana ProとGPT Image 1.5、Hunyuan Image 3.0の3つのみだった。

その中で、一番破綻が少なかったのは、Nano Banana Pro。

追記:
今回のプロンプトは以下のAlpakaさんのNoteを参考にさせていただきました。
プロンプト例もあったりと、分かりやすくまとまっています。

note.com/alpaka_ai/n/...

17.12.2025 01:49 — 👍 3    🔁 0    💬 1    📌 0
Hunyuan Image 3.0が作成した画像。

Hunyuan Image 3.0が作成した画像。

Seedream 4.5が作成した画像。

Seedream 4.5が作成した画像。

Wan 2.5 t2i Previewが作成した画像。

Wan 2.5 t2i Previewが作成した画像。

中国系のモデルでもやってみた。

Hunyuan Image 3.0(画像1枚目):
* 日本語は大丈夫
* 表の内容は大丈夫そうだが、色は微妙なのと、○と◎の区別がない
* 注釈の部分は崩れてしまった

Seedream 4.5(画像2枚目):
* 日本語でなく、中国語っぽくなってしまった
* 表はだめ
* 注釈も数が足りないし、中国語になっている

Wan 2.5 t2i Preview(画像3枚目):
* 日本語の問題以前に読めない
* 表の枠はいいものの、中身が意味不明
* 注釈もだめ

17.12.2025 01:25 — 👍 2    🔁 1    💬 1    📌 0
Flux 2 Maxが作成した画像。

Flux 2 Maxが作成した画像。

Imagen 4 Ultraが作成した画像。

Imagen 4 Ultraが作成した画像。

Flux 2 MaxとImagen 4 Ultraでもやってみた。

Flux 2 Max:
* 日本語は大丈夫なところもあるが、だめなところもある
* 上の方は表は問題ないが、下2行で壊れてしまった

Imagen 4 Ultra:
* 日本語怪しい
* 表がおかしい

Fluxはおしい(英語とかならできるかも?)が、Imagenはこのタスクは無理みたい。

17.12.2025 01:13 — 👍 0    🔁 0    💬 1    📌 0
Nano Banana(Gemini 2.5 Flash Image Preview)が作成した画像。

Nano Banana(Gemini 2.5 Flash Image Preview)が作成した画像。

GPT Image 1が作成した画像。

GPT Image 1が作成した画像。

参照として、それぞれの前のモデルもやってみました。
Nano Banana(Gemini 2.5 Flash Image Preview)と、GPT Image 1です(それぞれ、画像の1枚目と2枚目)。

Nano Banana:
* 日本語怪しい
* それぞれの情報の場所がおかしく、表として読めない
* 注釈の数が足りない

GPT Image 1:
* 日本語怪しい
* こちらも、場所がおかしく、情報が取得できない
* 注釈も足りないどころでなく、そもそも注釈の番号も読めない

どちらも、前の世代のモデルからは進化しているのが分かる。

17.12.2025 01:06 — 👍 0    🔁 0    💬 1    📌 0