← トップへ戻る

プレプリント ·研究論文 ·完成記事 ·AIによる読み解き

LLMの脆弱性検出は人間と同じ認知バイアスに影響を受けるのか？

LLMがコード脆弱性検出において人間と同じような認知的バイアスに影響を受けやすいことが明らかになりました。

元記事タイトル: コード脆弱性検出におけるLLMの認知バイアス：フレーミング効果とアンカー効果

arXiv cs.AI 2026年06月30日

査読未完了の可能性があります。完成した査読済み論文としてではなく、研究コミュニティ向けの早期共有として読んでください。

RESEARCH 研究論文 / Preprint

Field Note 読む前に確認

3行まとめ

大規模言語モデル（LLMs）は、コードの脆弱性を検出する際に認知的バイアスに影響を受けやすい
フレーミング効果、アンカー効果、ハロー効果を通じて実験が行われた
8つの異なるLLMと3種類のプログラミング言語が評価された

こんな人に関係ある話

セキュリティエンジニアソフトウェア開発者 AI研究者

信頼度メモ

プレプリント論文（査読前の可能性あり）

記事の読み解き Reading

元記事を材料に、要点、編集視点、良い点と懸念点を読みやすい順に整理しています。

この研究では、大規模言語モデル（LLMs）がコードの脆弱性を検出する際、人間と同じように認知的バイアスに影響を受けやすいことが明らかになりました。実験はフレーミング効果、アンカー効果、ハロー効果を通じて行われ、8つの異なるLLMと3種類のプログラミング言語が評価されました。結果として、LLMsはこれらの認知バイアスに影響を受け、特にフレーミング効果が最も大きな影響を及ぼすことが判明しました。

編集部コメント

この研究は、大規模言語モデル（LLMs）がコード脆弱性検出において人間と同じような認知的バイアスに影響を受けやすいことを示しています。これはセキュリティエンジニアやソフトウェア開発者にとって重要な洞察であり、今後の研究と実践の方向性を示唆します。

評価ポイント Assessment

良い点

LLMがコード脆弱性検出において人間と同じような認知的バイアスに影響を受けやすい
実験はフレーミング効果、アンカー効果、ハロー効果を通じて行われた
8つの異なるLLMと3種類のプログラミング言語が評価された

懸念点

研究では具体的なモデル名やプログラミング言語は明示されていない
実験結果が特定の状況に限定される可能性がある

業界・社会への影響 Impact

この研究は、LLMを用いたコード脆弱性検出における認知バイアスの影響を初めて明らかにし、セキュリティエンジニアやソフトウェア開発者にとって重要な洞察を提供します。また、モデルの信頼性と透明性の向上につながる可能性があります。

深堀り Deep Dive

前提知識

大規模言語モデル（LLM）は、ソフトウェア開発においてコードの脆弱性検出に用いられることが増加しています。しかし、LLMが人間と同様の認知バイアス（例：フレーミング効果、アンカー効果）に影響を受ける可能性は、これまであまり議論されていませんでした。この研究は、LLMが認知バイアスにどう影響されるかを初めて体系的に検証し、その結果を明らかにします。

何が新しいのか

本研究は、LLMがコード脆弱性の検出において人間と同様の認知バイアスに影響を受けることを初めて示した点が画期的です。特に、フレーミング効果が最も影響を与えることが判明し、LLMの判断が文脈によって大きく変化することを明らかにしました。また、セマンティックな推論が必要な脆弱性が、パターンマッチングで検出可能な脆弱性よりもバイアスに影響されやすいという新たな知見も得られています。

今後見るべき論点

LLMの認知バイアスへの対策として、文脈の影響を軽減するための技術開発が注目されるだろう
セマンティックな推論を強化するためのモデル設計の進展が期待される
LLMを用いた脆弱性検出におけるセキュリティ攻撃の可能性に注目が必要になる

用語解説

フレーミング効果情報の提示方法によって判断が変化する現象。例：同じデータを「90%の確率で成功」と提示するか「10%の確率で失敗」と提示するかで判断が異なる

アンカー効果最初に提示された情報（アンカー）が、後の判断に不適切に影響を与える現象

ハロー効果ある特徴（例：著名な開発者名）が、他の特徴（例：コードの品質）の評価に不適切に影響を与える現象

セマンティックな推論文脈や意味に基づいて判断を行う推論。例：コードの意図や論理構造を理解する

参照元 Sources

元記事と、深堀りで参照した情報源です。コミュニティ投稿やプレプリントでは、ここから根拠を確認できます。

コード脆弱性検出におけるLLMの認知バイアス：フレーミング効果とアンカー効果

arXiv cs.AI

https://arxiv.org/abs/2606.30587

この記事の見取り図

読む前に確認
記事の読み解き
深堀り
参照元
AI要約について
関連記事

キーワード

LLM コード脆弱性検出認知バイアスフレーミング効果アンカー効果

AI要約について

本記事の要約・分類・読み解きにはAIを使用しています。内容確認に努めていますが、誤訳・解釈違い・元記事更新の反映漏れを含む可能性があります。重要な判断を行う場合は、必ず元記事もご確認ください。

記事データ

Source	プレプリント
Category	研究論文
Status	完成記事
出典	arXiv cs.AI
公開日	2026-06-30

元記事の説明文

arXiv:2606.30587v1 Announce Type: cross Abstract: Researchers and practitioners increasingly apply Large Language Models (LLMs) for automated vulnerability detection. Recent work has shown that LLMs are susceptible to the same cognitive heuristics that bias human judgment. Yet, no work has investigated whether these heuristics affect a model's assessment of code vulnerabilities. In this paper, we present the first systematic exploration of cognitive heuristics in LLM-driven code vulnerability detection. We introduce a controlled framework that holds the code fixed and only varies the surrounding context to trigger three cognitive heuristics: the halo effect through author attribution, the framing effect through task objectives and consequences, and the anchoring effect through prior analysis results. Within this framework, we evaluate eight LLMs across three programming languages and perform both quantitative and code-level analyses. Our findings demonstrate that all evaluated models are susceptible to these heuristics. Cross-model average susceptibility is highest for framing at 33.2%, followed by anchoring at 23.5% and halo at 18.4%. Code-level analysis reveals that vulnerabilities that require semantic reasoning for detection are more susceptible to cognitive heuristics than those identifiable through pattern matching. Furthermore, models often change their verdict from safe to vulnerable based on the cognitive condition, without accurately identifying the actual vulnerability. To highlight the practical impact, we demonstrate a proof-of-concept black-box cognitive attack that can suppress up to 97% of previously detected vulnerabilities. These findings indicate that cognitive susceptibility is a consistent and exploitable property of LLM-based vulnerability detection.