← トップへ戻る

プレプリント ·研究論文 ·速報 ·AI要約未精査 ·AIによる読み解き

ACCが示すエージェント軌跡の新たな価値とは？

エージェントの行動履歴から有用な学習データを抽出し、LLMの長期コンテキスト理解能力を向上させるACCが提案されました。

元記事タイトル: エージェント軌跡から長期コンテキスト学習用データを作成するACC

arXiv cs.AI 2026年06月16日

査読未完了の可能性があります。完成した査読済み論文としてではなく、研究コミュニティ向けの早期共有として読んでください。

RESEARCH 研究論文 / Preprint

Field Note 読む前に確認

3行まとめ

ACCはエージェントの行動履歴から長文コンテキストを作成する
これによりモデルは直接的な回答生成能力が向上する
複雑な問題解決や高度なタスク自動化に寄与

こんな人に関係ある話

機械学習エンジニア AI研究者自然言語処理(NLP)開発者

信頼度メモ

プレプリント論文（査読前の可能性あり）

記事の読み解き Reading

元記事を材料に、要点、編集視点、良い点と懸念点を読みやすい順に整理しています。

この研究では、大規模言語モデル(LLM)が問題解決の過程で生成する大量のエージェント軌跡を活用し、長期的なコンテキストでの推論能力を向上させる手法であるAgent Context Compilation (ACC)が提案されています。ACCは、検索やソフトウェアエンジニアリング、データベースクエリなどのタスクで生成されるエージェントの行動履歴から、質問とツール応答・環境観測を統合した長文コンテキストを作成します。これにより、モデルは直接的な回答を生成する能力が向上し、長期的な依存関係モデリングタスクでの性能改善が期待されます。

編集部コメント

ACCは、エージェントが生成する大量の行動履歴データを活用してLLMの長期コンテキスト理解能力を高める画期的な手法です。ただし、実際の性能改善度や適用範囲については、さらなる研究と検証が必要となります。

評価ポイント Assessment

良い点

ACCはエージェントの行動履歴から有用な学習データを抽出する
長文コンテキストでのモデル訓練に必要な手間を削減
直接的な回答生成能力を向上させる

懸念点

ツール応答と環境観測が適切に統合されるかの評価が必要
長期的依存関係モデリングにおける実際の性能改善度は不明

業界・社会への影響 Impact

この手法は、LLMの長期的なコンテキスト理解能力を向上させることで、複雑な問題解決や高度なタスク自動化に寄与する可能性があります。また、大量のエージェント軌跡データから有用な学習信号を抽出することで、モデル訓練の効率性も向上します。

深堀り Deep Dive

前提知識

大規模言語モデル(LLM)の発展に伴い、長文コンテキストでの推論能力が求められるようになってきた。これに対応するためには、コストのかかる長いドキュメントの整備やヒューリスティックなコンテキスト合成が必要となる。しかし、エージェントは問題解決を行う際に大量の行動履歴を生成し、その中から必要な情報を抽出して回答を構築することが必要である。

何が新しいのか

本研究では、Agent Context Compilation (ACC)という手法が提案されている。これは、検索やソフトウェアエンジニアリング、データベースクエリなどのタスクで生成されるエージェントの行動履歴から質問とツール応答・環境観測を統合した長文コンテキストを作成することで、モデルが直接的な回答を生成する能力を向上させる。これにより長期的な依存関係モデリングタスクでの性能改善が可能になる。

今後見るべき論点

ACCが他の言語モデルに適用された場合のパフォーマンス向上の程度
エージェント生成した大量の軌跡から更なる有用な情報抽出方法の開発
長期コンテキストでの推論能力をさらに高める新たな技術開発

用語解説

エージェントタスクを解決するための自動化されたプロセスやソフトウェア。

大規模言語モデル(LLM) 大量のテキストデータから学習し、多様な応答を生成できる人工知能システム。

コンテキスト情報処理において重要な背景となる状況や文脈。

推論能力与えられた情報を基に新たな情報を導き出す能力。

Agent Context Compilation (ACC) エージェントが生成した軌跡から長文の質問応答ペアを作成し、大規模言語モデルを長期コンテキストでの推論能力向上させる手法。

参照元 Sources

元記事と、深堀りで参照した情報源です。コミュニティ投稿やプレプリントでは、ここから根拠を確認できます。

エージェント軌跡から長期コンテキスト学習用データを作成するACC

arXiv cs.AI

https://arxiv.org/abs/2605.21850

この記事の見取り図

読む前に確認
記事の読み解き
深堀り
参照元
AI要約について
関連記事

キーワード

Agent Context Compilation ACC long-context reasoning tool calling environment observation

AI要約について

本記事の要約・分類・読み解きにはAIを使用しています。内容確認に努めていますが、誤訳・解釈違い・元記事更新の反映漏れを含む可能性があります。重要な判断を行う場合は、必ず元記事もご確認ください。

速報について — 速報は追加調査や本文抽出の結果で内容が更新される場合があります。初期要約には誤りや不足が含まれる可能性があります。

記事データ

Source	プレプリント
Category	研究論文
Status	速報
出典	arXiv cs.AI
公開日	2026-06-16

元記事の説明文

arXiv:2605.21850v2 Announce Type: replace-cross Abstract: Recent development of agents has renewed demand for long-context reasoning capacity of LLMs. However, training LLMs for this capacity requires costly long-document curation or heuristic context synthesis. We observe that agents produce massive trajectories when solving problems, invoking tools and receiving environment observations across many turns. The evidence needed to answer the original question is thus scattered throughout these turns, requiring integration of distant context segments. Nevertheless, standard agent SFT masks tool responses and only trains turn-level tool selection, creating a supervision blind spot where these scattered signals go unused. We propose Agent Context Compilation (ACC), which converts trajectories from search, software engineering, and database querying agents into long-context QA pairs that combine the original question with tool responses and environment observations gathered across multiple turns, training the model to answer directly without tool use. This makes the dependencies between the question and the evidence explicit, enabling direct supervision of long-context reasoning over distant segments without additional annotation. ACC is a simple but effective approach that can be combined with any existing long-context extension or training method, providing scalable supervised fine-tuning data. We validate ACC on long-range dependency modeling tasks through MRCR and GraphWalks, challenging benchmarks requiring cross-turn coreference resolution and graph traversal over extended contexts. Training Qwen3-30B-A3B with ACC achieves 68.3 on MRCR (+18.1) and 77.5 on GraphWalks (+7.6), results comparable to Qwen3-235B-A22B, while preserving general capabilities on GPQA, MMLU-Pro, AIME, and IFEval. Further mechanism analysis reveals that the ACC-trained model exhibits task-adaptive attention restructuring and expert specialization.