長期記憶を持つAIエージェント、評価は可能か?MEMPROBEが示唆する新たな視点
MEMPROBE: 長期記憶を持つエージェントの評価
査読前の可能性がある研究情報
MEMPROBEは、長期記憶を持つエージェントの性能を評価するための新しいフレームワークを提案
速報・AI要約未精査
arXiv cs.CL
毎日更新・AIニュース考察
MEMPROBE: 長期記憶を持つエージェントの評価
査読前の可能性がある研究情報
MEMPROBEは、長期記憶を持つエージェントの性能を評価するための新しいフレームワークを提案
速報・AI要約未精査
査読前の可能性がある研究情報
AdaMemは、LLMエージェントの長期記憶を効率的に管理するための新しい手法です。
速報・AI要約未精査
こんな人にAI研究者・機械学習エンジニア
arXiv cs.AI査読前の可能性がある研究情報
WorldLinesは、長期的な視点から家庭内の支援タスクを評価する新しいベンチマークを提案
速報・AI要約未精査
こんな人にAI研究者・ロボット工学エンジニア
arXiv cs.AI査読前の可能性がある研究情報
LLMの長期記憶性能をより正確に評価する新しい手法MemTraceが提案されました。
速報・AI要約未精査
こんな人にAI研究者・機械学習エンジニア
arXiv cs.AI査読前の可能性がある研究情報
FragFuseは、大規模言語モデルエージェントのアクセス制御を迂回するための新たな攻撃手法です。
速報・AI要約未精査
こんな人にAIセキュリティ専門家・大規模言語モデル開発者
arXiv cs.AIGoogleが発表したTitansとMIRASは、生成型AIに長期記憶機能を持たせることで応答の一貫性を向上させる。
こんな人にAIエンジニア・データサイエンティスト
Google Research Blog