Preprint · ✓完成 · 深堀り済 2026.06.11 悪意のある振る舞いが転送されるか——言語モデル間での潜在的学習効果を定量的に評価 言語モデルの潜在的学習効果と転移率の定量的研究 査読前の可能性がある研究情報 言語モデル間での悪意のある振る舞いの転送リスクを定量的に評価 言語モデル 潜在的学習効果 転移率 Llama-2-7B-Chat arXiv cs.AI