今日のAIによる各種検定定点観測結果
2問中、全問正解なし、1問誤答が5
ChatGPT ◎?
Gemini ◎?
Claude ◎?
Grok ◎×
Felo ◎?
お天気検定
問題は東京、波除神社で災難を取り除くとされる生き物で、すべて正解
波除の由来まで解説したのはGemini、Claude、Felo
エンタメ検定
問題は今田美桜さんが最近身につけた料理テクニックで全滅
番組独自のインタビューで情報不足のよう
Grokはまとめサイトの予想をまに受けたのか,まだ終わってないうちから「語った」と過去形
でもヒントで回答絞れたはずだけど、そのまとめサイト大丈夫?
23.11.2025 23:04 — 👍 0 🔁 0 💬 0 📌 0
ひろゆき氏が語る“40代・50代エンジニア超優秀説” AI時代に活躍する条件 [1/2] | ログミーBusiness
【3行要約】・AIによるコード生成が一般化し、エンジニアの役割が問われる時代になっています。・西村博之氏は自身のエンジニア経験から「仕組み丸ごと理解」の重要性を指摘し、40代・50代エンジニアの再評価に言及。・仕組みを丸ごと理解し、コストと...
当たり前だけど、この世代の人が全て優秀なわけはないどころか、誰もが自分でサーバー立てたりしてないから
50代はマイコンブーム世代だから、マイコン(パソコン)持ってた人が居ても、ゲームで終わるのがほとんど
一部がベーマガやアイオーのリスト入力するが、入れて遊ぶだけ
そこから興味持ってプログラミング進むのは1割程度では?
さらにMINIXや*BSD、Linuxに進むのが3割くらい?
周りがそういう人多いとこの人は誤解しがちだけど、世間はそんなもんよ?
https://logmi.jp/main/technology/332718#
23.11.2025 00:57 — 👍 1 🔁 0 💬 0 📌 1
今日のAIによる各種検定定点観測結果
2問中、全問正解4、1問誤答が1
ChatGPT ◎◎
Gemini ◎×
Claude ◎◎
Grok ◎◎
Felo ◎◎
お天気検定
問題は高崎市にある観音像の場所で、すべて正解
問題文が50年かけた観音像とあったので、つくるのにかかったのかと思いきや、洞窟を掘るのに50年かかったよう
エンタメ検定
問題は映画で共演した倍賞千恵子さんと木村拓哉さんのルーティンで、Gemini対その他に
結果的にGeminiの負け
21.11.2025 02:56 — 👍 1 🔁 0 💬 0 📌 0
Vivaldiはリリースノートによると7.7.3851.48で対応しているっぽい
https://update.vivaldi.com/update/1.0/relnotes/7.7.3851.52.html
20.11.2025 05:00 — 👍 0 🔁 0 💬 0 📌 0
【悲報】Microsoft、Copilot自慢ツイートが炎上。コーヒーを飲み終える前に開発者から総ツッコミへ | ソフトアンテナ
Microsoftが公式X(旧Twitter)アカウントで「Copilotがあなたのコーヒーを飲み終える前にコードを完成させる」という投稿を行い、開発者コミュニティから強い反発を受けていたことがわかりました(Windows Central)
「開発者から寄せられた返信の中には『Windowsが不安定なのはCopilotのバイブコーディングのせいでは?』と皮肉る声も」とか、うまいね
記事中の翻訳はわかりにくい例
主語だからと冒頭に持ってきたのもあまりよくない
直訳なら「あなたがコーヒーを飲み終える前に、Copilotがあなたのコードを書き上げます」
こういう台詞ってアップルが言いそうなので、もうちょっとそれっぽくするなら「Copilotがコードを書き上げます、あなたがコージーを飲み終わる前にね」かな
https://softantenna.com/blog/microsoft-copilot-tweet/
20.11.2025 04:44 — 👍 0 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
2問中、全問正解3、1問誤答が2
ChatGPT ◎◎
Gemini ◎◎
Claude ×◎
Grok ◎◎
Felo ×◎
お天気検定
問題はピザのミラノとマンハッタンの違いで回答が割れましたが多数派の勝ち
今回はChatGPTだけでなくGeminiも表など使った長めの回答
Grokが程よい感じ
エンタメ検定
問題は吉田栄作さんが体型維持するための方法で、すべて正解
回答は大きな差はない感じ
今回もGrokは簡潔で、他は長めの回答
20.11.2025 01:08 — 👍 1 🔁 0 💬 0 📌 0
信長・出陣は基本的に老眼にはつらいのだが、地図内の市町村名を見た目重視で白抜き文字かつ明朝風にするのは勘弁して
開発陣も今は老害は引っ込んでろって思ってるかもしれないが、40前後にはあれ?ってなって、50後半にはあの頃はまだましだったんだと思い知るで
18.11.2025 00:18 — 👍 0 🔁 0 💬 0 📌 0
Grokは一時は大外しが多かった印象だけど、最近は好調?
ChatGPTは逆に外すことが増えてる印象
Feloは長い
Claudeは検索が弱い印象
なお、ClaudeとFelo、Geminiは課金してます
ChatGPT、Claude、Geminiはカスタムプロンプト入れてます
どのサービスも回答の速さ重視でディープリサーチ等やプロモードは使ってません
そのため完全に同条件ではないというのはご了承ください
17.11.2025 23:38 — 👍 0 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
2問中、全問正解2、1問誤答が3
ChatGPT ◎?
Gemini ◎×
Claude ◎?
Grok ◎◎
Felo ◎◎
お天気検定
問題は江戸時代の猪肉の別名
回答に大きな差はないですが、番組の解説にあった食感が似ていたという理由はGrokのみ
エンタメ検定
問題は多部未華子さんがこの冬やりたいこと
的確だったのはやや長いけどFelo
ヒントになるかと思って某社のCM出演のことを書いたところ、ChatGPTは CM内での話と誤解
GeminiとClaudeもグラコロのCMまでは分かったものの過去の話から回答
17.11.2025 23:32 — 👍 1 🔁 0 💬 0 📌 1
おそらく同じ研究の話で「AI依存が過ぎると思考力が低下する」って話だが、一方は「可能性」、もう一方は断言
と言うか、東洋経済は憶測盛りすぎじゃない?
別にAIと関係なく、自分で考えなければ思考力が低下するってのは当然だよね
※AI擁護ではないですよ
https://www.gizmodo.jp/2025/02/microsoft-ai-user.html
https://toyokeizai.net/articles/-/859462
17.11.2025 03:56 — 👍 0 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
1問ですべて正解
ChatGPT ◎
Gemini ◎
Claude ◎
Grok ◎
Felo ◎
お天気検定
問題は蓮根の穴の理由で、すべて正解
GeminiとClaude以外は他の選択肢の解説もあり
ChatGPTは無料ユーザーですが5.1でした
最近は1行回答が多かったですが、今日は箇条書きを使ってわかりやすくしてました
エンタメ検定は休み
16.11.2025 22:37 — 👍 1 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
2問中、全問正解1、1問誤答が4
ChatGPT ◎?
Gemini ◎×
Claude ◎?
Grok ◎◎
Felo ◎?
お天気検定
問題は相模原市、新磯のざる菊で最後になった花文字
すべて正解ですが、中には怪しい回答も
昨日別件では饒舌だったChatGPTもまた一言回答
理由まで解説したGeminiとFeloが好印象
エンタメ検定
問題は今日放送の番組のエピソードなので仕方ない
Geminiは過去の話を持ってきたけど、誤情報のような
Grokは割と正確ですが、細かいミスもあり本当なのか適当なのか微妙
14.11.2025 00:36 — 👍 1 🔁 0 💬 0 📌 0
よくプログラミング言語を人間のためのものと言うし、それは間違ってない
ただ、自然言語はどうしても曖昧だから、曖昧さを排除できるものが必要
生成AI以前はそれをモデル(表現方法としてはUML等)とする考え方があり、その後は決まった書式の設計書から自動生成とかいう取り組みもあった
結局何らかの暗黙的か明示的なルールがないと曖昧さを排除するのは難しく、生成AIに指示するのは一見自然言語のように見えるが似て非なるものにしかならないんだよな
結局、生成AIに与えるコンテキストに何を使うかという試みを見てると、今までたどってきた道を再度たどってることが分かる
13.11.2025 02:15 — 👍 2 🔁 1 💬 0 📌 1
AIの質問を『選択肢+推奨度+理由』にしたら、意思決定の質と速度が圧倒的にあがった
なるほどねぇと思ったけど
できる人は言われなくてもこれくらいするんだが、AGIになったらその域になるのかね?
それはともかく、一時期はやったオフショア思い出した
あまり関わらなかったけど、一応ブリッジSEっていう日本語できる現地技術者が居るんだが、その1人通すよりも言葉通じなくても片言英語+疑似プログラミング言語の方が効率的ってなる
そりゃ、日本人同士だってそうなりがちだから当然なんだけど
それ考えると、自然言語で生成AIに指示してプログラム書かせるっていかに非効率か
https://zenn.dev/loglass/articles/e250a06fca1f4a
13.11.2025 02:15 — 👍 1 🔁 1 💬 1 📌 0
うわ、SNSで「Rustの信頼性は世界一じゃなかったのか」とかいうポスト見ちゃった
Rustだろうと何だろうと、ダメな作り方すればダメなんだが
物事を表面的にしか見てない人を見分けるリトマス試験紙にはなるけど
RustだろうがAGIだろうが、○○なら安心とか言っちゃう人はこれから先生き残れるのか?
ま、Rust側が安全安全言い過ぎたというのもあるのかもしれないが
そういうやり方してると何かあるとすぐ「安全神話崩壊!」とか騒ぐ分かってない人が出てくるのは分かってると思うけど
自分もそうだが「分かる人に分かればよい」ではダメなんだよね
13.11.2025 00:57 — 👍 0 🔁 0 💬 0 📌 0
生成AIについては、もはやIAEAならぬIAIAとかつくって原子力並に規制、監視する必要があると思うが、それを言い出せそうな国が軒並み生成AIで何かしてやろうってとこばかりだから、まず無理なんだよな
フランス辺りなら言い出しそうな気もするが、国内問題でそれどころじゃないだろうし
13.11.2025 00:49 — 👍 0 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
1問中正解が3、誤答が2
ChatGPT ×
Gemini ◎
Claude ×
Grok ◎
Felo ◎
お天気検定
問題は立川まんがぱーくが元々何だったかで、小学校と市役所に割れました
公式サイトに旧庁舎の活用と明記されてるので、これを外すのはいかがなものか?
Claudeはもっともらしく旧立川第五小学校と説明してました
ChatGPTも最近誤答が増加気味?以前は表や絵文字で分かりやすくしようとしてたのが、最近はあっさり回答が増えてるので調整が入った?
エンタメ検定は休み
12.11.2025 22:37 — 👍 1 🔁 0 💬 0 📌 0
ホテルLANだと有線のケースと無線のケースがあるけど、住宅の場合は有線が普通なのかな?
それとも場合によっては各部屋に無線LANのAPがあるようなケースもあるのかな?
そういうのがある時代に部屋探ししたことないので分からんのだが
12.11.2025 08:17 — 👍 0 🔁 0 💬 0 📌 0
「この部屋Wi-Fiありますか?」と不動産屋に聞くのは筋違いじゃない | 日経クロステック(xTECH)
記者はSNSで、不動産屋らしい人物による気になる投稿を見つけた。客に物件を紹介する際「この物件にWi-Fiはあるか」と聞かれ、いらだったというもの。客と不動産屋の間に行き違いが発生した背景には、人によって異なる「ネット接続環境の常識」がある。
元のSNSポストの内容が書いてないので細かい点が不明だが、WiFi(正確にはインターネット接続可能な有線LANポート?)の有無を訊いただけで、なんでイライラさせるのか分からないのだが
記事にあるような事情は分かるが、自分で用意するのか提供されているのかを確認するために訊くのはいけないのか?と思ってしまうのは、単に記事が説明不足なだけ?
付いてて当たり前!前の部屋にはあったから無料で付けろ!って話ならイラつくのは分かるけど
https://xtech.nikkei.com/atcl/nxt/column/18/00138/110501886/
12.11.2025 08:17 — 👍 0 🔁 0 💬 1 📌 0
型安全を理解するには型を理解しないといけないし、型を理解するのは単に整数型だ、小数型だ、文字列型だといったものを理解することではない
ってのを理解できないと難しいんじゃないかなぁ
何かの数値を扱うとき、それが全部intなりintegerなりでよいのか、って話
12.11.2025 02:31 — 👍 0 🔁 0 💬 0 📌 0
今日のAIによる各種検定定点観測結果
1問中正解が4、誤答が1
ChatGPT ◎
Gemini ◎
Claude ◎
Grok ×
Felo ◎
お天気検定
問題はいばらきフラワーパークの温室レストランにあるテラスでできること
Grok対その他で多数派の勝ち
Grokは正解が期間限定だからと外したようですが、挙げたものはそんざいしてないよう
正解組では詳しいがくどいFeloと一言回答のChatGPTを除くと差は小さいですが、それで楽しめることを出してきたClaudeがやや好印象
エンタメ検定は休み
12.11.2025 00:51 — 👍 1 🔁 0 💬 0 📌 0
その辺りを含めてAIさんに分析してもらったら「論理が飛躍している」とこちらに忖度した回答をしてきたが、擁護するわけではないがこういう視点もあるのでは?というやりとりしてたら「説得力のある記事」とか言いだした
いやはや、浅すぎるよ(いわゆるディープサーチじゃないし、雑なやりとりだから仕方ないけど)
なんかの詐欺に騙されそうな人みたい
11.11.2025 01:40 — 👍 0 🔁 0 💬 0 📌 0
AI普及で優秀な人の仕事は減り、能力の低い人の仕事が増えた? LLMで「実力主義」が崩壊(生成AIクローズアップ) | テクノエッジ TechnoEdge
大規模言語モデル(LLM)の登場で、誰でも簡単に、非常に質の高い文章が作れるようになりました。この変化は、特に就職活動や仕事の応募といった場面で大きな影響を与えています。
タイトル詐欺とまでは言わないけど、ちょっと釣りぎみかなぁ
ここで言ってるのは
- かっては採用側の指標として応募文書の出来で間接的に相手を測れた
- AIで文書化するとその手が無効に
- その結果、コスト重視に
- そうすると優秀=コスト高な人は敬遠され、低コストで採用されがち
結局は採用側の手抜き
よく分からないから安い方にしておけば、損害も小さいって後ろ向きな考え方
で、よく考えると本当にAI普及の問題なのか、単に景気の悪化によってそうなっているのか微妙なんだよね
https://www.techno-edge.net/article/2025/11/11/4709.html
11.11.2025 01:40 — 👍 0 🔁 0 💬 1 📌 0
WNLで気象予報士さんが以下のようなこと言ってて面白い
- 関東は予想と違って雲が広がってる
- モデルでは晴れになってる
- むしろ昨日のモデルの方が的確だった
モデルより現実が正しい(当たり前)んだけど、モデルの方ばかり見て現実見ない人多いんだよな
11.11.2025 00:42 — 👍 0 🔁 0 💬 0 📌 0
We're an Al safety and research company that builds reliable, interpretable, and steerable Al systems. Talk to our Al assistant Claude at Claude.ai.
SLGを中心に、主にPCゲームについて取り上げるサイトを運営しています。このアカウントでは主に更新情報をツイートします。
https://simulationian.com/
Build something you believe in.
#Civ7 is available now worldwide!
https://gihyo.jp/ の掲載記事を取り上げていきます。
※IDにドットが含まれていることにご注意ください。
Take command and lead your nation through World War II, the largest conflict in world history, in Hearts of Iron IV.
• discord.gg/hoi4
• pdxint.at/HOIYouTube
Real strategy requires cunning! | Official Account for Crusader Kings | Join our Discord! http://discord.gg/ck3 | PEGI: 12+ | ESRB: MATURE 17+
Grand Strategy on a Galactic Scale
stellaris.com | discord.gg/stellarisofficial | youtube.com/@StellarisOfficial
money
Posting #USDJPY #ドル円 #JPY #USD #EUR #GBR #AUD #NZD #CNY #CHF #CAD
BTC and ETH are not real, so I do not post those.
週刊誌「ニューズウィーク日本版」(毎週火曜日発売)および「ニューズウィーク日本版サイト」公式アカウントです。
https://www.newsweekjapan.jp/
『日経サイエンス』はNatureの一般向け科学雑誌『SCIENTIFIC AMERICAN』の日本語版。
わかりやすい説明と豊富な図版で,世界の科学ニュース・注目の研究を日本の皆さんにお届けします。
📗https://www.nikkei-science.com/
日本経済新聞(日経電子版)の公式アカウントです。トップページで報じたニュースを中心に注目コンテンツを発信していきます。
https://www.nikkei.com/
Steam, The Ultimate Online Game Platform.
For support: http://help.steampowered.com/en/
1996年慶應義塾大学法学部政治学科卒、23年新潟大学修士(法学)、一般財団法人情報法制研究所/事務局次長・上席研究員。専門は統計分野、社会調査、制度設計と、投資実務および置物系コンサルティング業務全般。
日本の主要トレンドトピックを30分ごとに投稿します 🌱🌏 フィードリストはこちら https://bsky.app/profile/trendingjapan.bsky.social/lists/3l5fppmrqqp2c 開発 @terraprotege.bsky.social terraprotege@gmail.com
「ゲームの面白い記事読んでみない?」あなたの時間を奪う、読み応えたっぷりの記事をお届け!「電ファミニコゲーマー」の公式アカウントです。
ハードコアゲーマーのための情報サイト「Game*Spark」(ゲムスパ)公式アカウント。最新ゲームのニュースをお届け!
🔗https://www.gamespark.jp/
A third-party Bluesky client for You!
https://tokimeki.blue/
Android: https://play.google.com/store/apps/details?id=blue.tokimeki.tokimeki
Discord: https://discord.gg/DAU6RJsqj3
4Gamer / スマホゲームからコンシューマゲーム,PCゲーム,eスポーツ,さらには乙女ゲーやアナログゲームまで,ゲームに関するあらゆる情報を追う日本最大級の総合ゲーム情報サイト,4Gamer.netの公式アカウントです。日々更新され続ける最新ニュースと,20年以上にわたって蓄積された情報をご確認ください。
週刊少年サンデー連載中『葬送のフリーレン』(原作:山田鐘人/作画:アベツカサ)の原作公式アカウントです。更新情報などを編集部員がつぶやきます。第15巻・特装版・前奏2・人狼・ぬり絵12月18日頃発売!TVアニメ第2期2026年1月16日放送。
AUTOMATON(オートマトン)は、今話題のニュースやコミュニティ発のトピックを深掘りし、Veracity in Gaming、すなわち「ゲームと誠実に向き合い、正しく伝えること」をコンセプトとするゲーム情報サイトです。
https://automaton-media.com/