こちらは昨年8月。
「チャットハルヒ」既存のキャラクターの性格をLLMに模倣させることに特化したフレームワーク
ai-data-base.com/archives/54606
「普通の人間には興味なさすぎて返答がぞんざいになりそう」「会話8月に終わらなさそう」「他のキャラでやって欲しかった気もする」などと、コアな内容のコメントが多くついていました。
@aidb.bsky.social
論文ベースで研究にキャッチアップするメディアです ■DiscordコミュニティはAIDBマイページから ■blueskyではまずこれまでの人気コンテンツを紹介していきます
こちらは昨年8月。
「チャットハルヒ」既存のキャラクターの性格をLLMに模倣させることに特化したフレームワーク
ai-data-base.com/archives/54606
「普通の人間には興味なさすぎて返答がぞんざいになりそう」「会話8月に終わらなさそう」「他のキャラでやって欲しかった気もする」などと、コアな内容のコメントが多くついていました。
こちらも12月の発表です。
Googleがさまざまな指標でGPT-4を超えたことを主張するマルチモーダルLLM『Gemini』を発表しました。
ai-data-base.com/archives/60035
日本時間の深夜にも関わらず国内でもすぐに話題になり、大きく盛り上がりを見せました。
そして先日、Geminiの中で最も性能の高いモデルであるUltraが利用可能になり、引き続き注目されています。
同じく昨年12月、「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル(LVM)を構築するアプローチを開発しました。
ai-data-base.com/archives/60337
UCバークレーなどによる発表でした。
非常にセンセーショナルな学術的進歩として捉えられ、AIの最新動向をウォッチする方々から大きな反響がありました。
昨年12月、DeepMindの研究者らがLLMに自ら高品質な訓練データを生成させる「自己学習」に関する実験結果を発表しました。
ai-data-base.com/archives/60538
今回は数学に特化した実験でしたが、人間作成データによる追加の学習なしで、LLM自身の生成したデータで性能が向上することを示す結果が得られています。
一般ユーザーからは期待と不安が入り混じる感想が多く寄せられる一方、開発者・事業者目線では強く賛同する声が目立っていました。
昨年の10月、GPT-4をセラピストとして実行し、人々の「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』が考案されました。
ai-data-base.com/archives/56696
本記事ははてなブックマークで総合1位に掲載され、好意的なコメントも多く寄せられていました。
また、本フレームワークを反映したGPTsも多くの方に使っていただきました。(記事とXの投稿でリンクを貼っています)
昨年11月、「自分を信じて限界を超えてください」「成長の機会だと捉えて挑戦してください」など感情をグッと込めたプロンプトを添えられると、GPT-4などさまざまなLLMは、出力の精度を向上させることが実験結果として報告されました。
Microsoftなどの研究グループによる発表で、EmotionPromptと命名されています。
ai-data-base.com/archives/58158
なお、かねてより松岡修造メソッドと呼ばれて親しまれていた手法の有効性が明らかにされた形となり、ユーザーの間で大きな話題になりました。
ポーカーなどの不完全情報ゲームを上手にプレイするGPT-4ベースのエージェント『Suspicion-Agent(Suspicion:疑心)』が発明されています。
ai-data-base.com/archives/56141
鍵となるのは"心の理論"。
東京大学の松尾豊氏ら研究グループによる発表です。
(2023年10月のアーカイブ記事)
日本医師国家試験にGPT-4が合格するという実験結果
ai-data-base.com/archives/51676
ワシントン大・札幌心臓血管クリニック・東北大・イエール大学の研究者グループによる発表。過去5年間にわたる試験で複数の大規模言語モデルをテストした所、GPT-4は全ての年の試験で合格したとのことです。
(2023年4月のアーカイブ記事)
論文ベースで研究にキャッチアップするメディアのAIDBです。こちらでも実験的に投稿します。
よろしくお願いします!