Twitter(X)まともに動かんなあ
01.04.2025 01:42 — 👍 1 🔁 0 💬 0 📌 0@chromarock.bsky.social
Programming cat.l love programming. Native language is c/c++ インターネッツリサーチャー/INTJ-T https://chromabox.github.io/140m/
Twitter(X)まともに動かんなあ
01.04.2025 01:42 — 👍 1 🔁 0 💬 0 📌 0AIの頭の中ではどのように情報が処理されて意思決定が行われるのかをAnthropicが解説
https://gigazine.net/news/20250328-anthropic-traces-thoughts-of-llm/
今回OpenAIがお出しになられた生成機能は、これまで出てきたのとはちょっと違ってて割と謎な機構で動いている感あるし、結構GPUパワーつかってそうだよなぁとは思う
28.03.2025 00:00 — 👍 0 🔁 0 💬 0 📌 0意外と処理重たいのかなと
→
ChatGPTの新画像生成、利用急増で無料ユーザー向け延期 「GPUが溶けてる」とCEO - ITmedia NEWS www.itmedia.co.jp/news/article...
というかOpenAIがここまでやる前からこうなることはわかっていたわけで、この後に及んで今更たたき棒にするのはどうなんかねぇとは思う
結局叩きたいだけでしょみたいな感
画風に著作権が認められるかは結構難しくて、しかも著作権って国によって解釈が違うこともあるからここでも結構ハードルは高い
27.03.2025 04:31 — 👍 0 🔁 0 💬 0 📌 0ChatGPTにGPT-4oでの画像生成機能が実装されスタジオジブリ風のミーム画像が大量生成されるようになり著作権問題が浮き彫りに
https://gigazine.net/news/20250327-openai-viral-studio-ghibli-ai-copyright/
画像系AIを触ってると、プロンプトに指定した要素をモデルが覚えていないっぽくて空振り多そうでも(ガチャするとまれに出てくるパターン)それに関連したワードを追加で足して寄せたりすると高確率で出てきたりするので、まるで連想するワードを教えて思い出させるみたいな、ヒトに記憶を思い出させてるような感覚に陥ることがままある…
やっぱりAIもヒト脳もこの辺はもしかしたら似たような感じなのではないかと…
NAI v4、condition用にT5が出てきたということはやっぱり最近のDiT+T5 (SD3.5系列)なのかなと
11.03.2025 03:48 — 👍 0 🔁 0 💬 0 📌 0NAIが作ったT5のgithubこれか
github.com/NovelAI/t5
NAI、謎にV4で使っているT5だけオープンで出してきた
x.com/novelaioffic...
小型LLMを使う問題はうまく回さないとVRAM足らなくなるくらいかねぇ
05.03.2025 00:09 — 👍 0 🔁 0 💬 0 📌 0Sanaも確か小型LLM+DiTな構成だったような
VAEに独特の特徴があるけど
これもUnetじゃなくてDiT(Transformer系)らしい
TE部分はGLM-4-9Bということで小型LLM?
SD3.5もSanaも確かDiTだしもうDiTの流れなんだろうなと
→
とうとう現れたSDXLの後継?CogView4-6Bを解説する | 動詞
zenn.dev/discus0434/a...
これからはComfyUIの時代だなぁと思って、ComfyUIのAPI触ってWebからじゃなくてC++のアプリから動かすやつをC++(With websocket)使ってやったのだけど、これまた資料まじで少ないのでしんどかった…
(A1111は割とかんたんで、すでにできていて色々やれるようになってる)
websocketでやり取りできて、とりあえず形にはなった
最近はOSSを履き違えしている人たちが多くて、無料でなんでもしてくれるみたいなことを思う人も結構居る
こ◎きは際限なく要求してくるからノー(NO!)と言えることが大事
これを見て思ったのだけど、この方は繊細というかサービス精神旺盛だったんだなぁと。。。。
OSS開発者にはある種の図太さが必要
→
marcan.st/2025/02/resi...
noobは後ろに大きなパトロンが居るか、もしくはオタクが狂って全財産投入したんではみたいに思ってる
13.02.2025 01:45 — 👍 0 🔁 0 💬 0 📌 0高性能AIモデルを作ってお披露目するのは、それで商売をするのではなくて、別に本業があって本業で儲かってカネ余ってしょうがないみたいな企業が売名のためにやるくらいしか難しいのではみたいに思ってる
(例えばDeepSeekみたいに…あれは本業が儲かったので作ったっぽいし)
モデルを作るのはお金も時間も手間もかかるわけで、何処かでそれを回収しないといけないのだけど、ずっと回収できないままだと投資している人から詰められるだろうし(あるいは自腹を切ることになる)、AIモデルを作ってそれで商売をするのが如何に難しいかがよくわかる
13.02.2025 01:36 — 👍 0 🔁 0 💬 0 📌 0noobが出てきてかなり使えてしまったことが、Omonの人たちが当初考えていた図と大きな誤算だったんだろうなぁ感はある
Fluxみたいに最低でも1.0、1.1、3.5全部揃えてから「これ有料だけどこれ無料だよ」ってリリースするべきだった
→
Developer of Illustrious model has post a message on Korean website
www.reddit.com/r/StableDiff...
モデルを作るのもタダじゃないからねぇ
www.reddit.com/r/StableDiff...
流行りなんで書きました
ローカルLLMデビューしたい
→
140文字以上: ollamaをUbuntu 24.04 にインストールしてDeepSeek(の量子化モデル)に触れてみる
chromabox.github.io/140m/linux/u...
Animazineを作ったチーム、V4.1を作った後はモデルを作るんじゃなくてノベルゲーを作りたいらしい
モデル作るのにはとにかくお金と時間と手間がかかるから、SD3.5とかこれ以上大きなモデル規模になってくると厳しいからかな
→
cagliostrolab.net/posts/animag...
魔神4でたか~
civitai.com/models/1188071
最近Diffusersを触りだしてSANA使ってみたけどむずい
まだまだ開発中なようで完成したらよさそうではある
SD3.5ベースのillustlious来るかも見たいな話
本当に出てきたらSD3.5時代がようやく到来しそう
→
huggingface.co/AngelBottoml...
最近PytorchにFP16を早くするみたいなパッチがマージされそうらしい。C++ちょっとできるので読んでみたらFP16での処理がちょっと抜けてたみたいな感じかなこれ
Volta以降って書かれているので、40XX系全部が恩恵受けそう
→
[CUDA][cuBLAS] cuBLAS/cuBLASLt に fp16 累積オプションを追加
github.com/pytorch/pyto...
三大AI系いつ寝てるかわからないひと
kijai氏
iria氏
kohya氏
kijaiさんいつ寝てるのあのひと…という話
→
www.reddit.com/r/StableDiff...