Community · 速報 · AI要約未精査 · 深堀り済 2026.05.16 長文処理コスト削減——新アーキテクチャがもたらす影響とは? LLMアーキテクチャの最新動向:KV共有、mHC、圧縮アテンション 個人の見解・実装体験を含む記事 新規オープンウェイトLLMが長文処理コストを削減 速報・AI要約未精査 KV Sharing mHC Compressed Attention Gemma 4 Ahead of AI