← トップへ戻る

プレプリント ·研究論文 ·速報 ·AI要約未精査 ·AIによる読み解き

AdaMame：大規模モデルの多言語推論をどう進化させるか？

AdaMameは、多言語推論モデルのトレーニングを改善し、言語崩壊問題への対策を提供する。

元記事タイトル: アダマメ：多言語適応的推論モデルのトレーニング手法

arXiv cs.AI 2026年06月16日

査読未完了の可能性があります。完成した査読済み論文としてではなく、研究コミュニティ向けの早期共有として読んでください。

RESEARCH 研究論文 / Preprint

Field Note 読む前に確認

3行まとめ

AdaMameは二段階のトレーニング手法で多言語推論モデルの性能を向上させる。
言語崩壊問題に対する新たなアプローチとしてGRPOに基づくAdaMame-GRPOが提案されている。
低リソース言語でのパフォーマンス評価と実用性検討が必要な段階である。

こんな人に関係ある話

AI研究者機械学習エンジニア多言語対応のAIシステム開発者

信頼度メモ

プレプリント論文（査読前の可能性あり）

記事の読み解き Reading

元記事を材料に、要点、編集視点、良い点と懸念点を読みやすい順に整理しています。

AdaMameは、大規模な推理モデル（LRMs）が英語以外の言語で推論を行う際の言語崩壊問題を解決するための二段階トレーニング手法です。この手法は、自然発生的な多言語推論データを使用してモデルを微調整し、その後、グループ相対政策最適化（GRPO）に基づくAdaMame-GRPOで言語適合性を向上させます。AdaMame-GRPOは、精度、言語忠実度、トークン効率において全ての基準に対してパレート最適な性能を達成しています。

編集部コメント

AdaMameは多言語対応の大規模モデル開発における新たなアプローチを提示しています。しかし、低リソース言語への適用性や実際の利用環境でのパフォーマンス評価が今後の課題となります。

評価ポイント Assessment

良い点

多言語推論における言語崩壊問題への対策
二段階トレーニング手法による精度と効率性の向上
12言語での実験結果が示すパレート最適な性能

懸念点

言語変換時のコードスイッチング問題への影響は不明確
低リソース言語に対する汎用性と効果の検証が必要

業界・社会への影響 Impact

AdaMameは、多言語対応の大規模モデル開発における重要な進展を示しており、特に低リソース言語での推論性能向上に貢献する可能性があります。これにより、グローバルなコミュニケーションや教育分野でのAIの活用が更に広がることが期待されます。

深堀り Deep Dive

前提知識

大規模な推論モデル（LRMs）は英語でのパフォーマンスが優れている一方で、多言語環境では言語の特性に適応できないという問題がある。これは自然言語処理や機械学習の分野において、モデルを異なる言語間で効果的に使用するための重要な障壁となっている。

何が新しいのか

AdaMameは、多言語環境での推論能力を向上させるための新しい二段階トレーニング手法である。自然発生的なデータを使用してモデルを微調整し、その後グループ相対政策最適化（GRPO）に基づくアダプテーションにより言語適合性を改善する。これにより、精度と言語忠実度のバランスを取りつつトークン効率も向上させる。

今後見るべき論点

AdaMameがより多くの言語や応用分野に拡張され、その有用性が広範囲で確認される
多言語モデルのトレーニング技術が進化し、さらなるパフォーマンス向上と効率化をもたらす
自然言語処理や機械学習における大規模モデルの適用範囲が拡大するに伴い、AdaMameのような技術が重要性を増す

用語解説

大規模な推論モデル（LRMs）大量のデータから学習して複雑なタスクを処理できる高度な人工知能モデル

自然発生的な多言語推論データ実世界で自然に生成される異なる言語間での推論の過程や結果

グループ相対政策最適化（GRPO）複数の状況や条件に対応するための効果的な学習方策を導き出すアルゴリズム

参照元 Sources

元記事と、深堀りで参照した情報源です。コミュニティ投稿やプレプリントでは、ここから根拠を確認できます。

アダマメ：多言語適応的推論モデルのトレーニング手法

arXiv cs.AI

https://arxiv.org/abs/2606.15080

この記事の見取り図

読む前に確認
記事の読み解き
深堀り
参照元
AI要約について
関連記事

キーワード

AdaMame 多言語推論 GRPO 言語崩壊精度向上

AI要約について

本記事の要約・分類・読み解きにはAIを使用しています。内容確認に努めていますが、誤訳・解釈違い・元記事更新の反映漏れを含む可能性があります。重要な判断を行う場合は、必ず元記事もご確認ください。

速報について — 速報は追加調査や本文抽出の結果で内容が更新される場合があります。初期要約には誤りや不足が含まれる可能性があります。

記事データ

Source	プレプリント
Category	研究論文
Status	速報
出典	arXiv cs.AI
公開日	2026-06-16

元記事の説明文

arXiv:2606.15080v1 Announce Type: cross Abstract: While Large Reasoning Models (LRMs) show strong performance in English, they often fail to reason in the language of the query, a phenomenon known as language collapse. Existing RL-based fixes typically add a binary language fidelity reward to the accuracy objective, yet still incur trade-off in accuracy, mid-trace code-switching, and excessive token usage. In this work, we propose AdaMame, a two-stage training recipe for multilingual mathematical reasoning that addresses these limitations by adaptively aligning the reasoning language to the query language without compromising accuracy. The first SFT stage fine-tunes on naturally occurring reasoning traces across five languages to establish multilingual reasoning capability. In the subsequent RL stage, we introduce AdaMame-GRPO, an adaptation of Group Relative Policy Optimization (GRPO) in which a query-conditioned alignment factor grows progressively during training, guiding the model to first explore diverse reasoning languages before exploiting reasoning in the query language. Evaluated across two benchmarks, two LRMs, and 12 languages, AdaMame-GRPO achieves Pareto-optimal performance across reasoning accuracy, language fidelity, and token efficiency over all baselines, with the strongest gains on out-of-domain, lower-resource languages.