論文の概要: When AI Navigates the Fog of War
- arxiv url: http://arxiv.org/abs/2603.16642v1
- Date: Tue, 17 Mar 2026 15:13:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.360486
- Title: When AI Navigates the Fog of War
- Title(参考訳): AIが戦争の霧をナビゲートする時
- Authors: Ming Li, Xirui Li, Tianyi Zhou,
- Abstract要約: 我々は、現在のフロンティアモデルのトレーニング遮断後に展開された2026年の中東紛争の初期段階について研究する。
我々は,11の臨界時間ノード,42のノード固有の検証可能な質問,および5つの一般探索質問を構築した。
この研究は、拡大する地政学的危機において、モデル推論のアーカイブスナップショットとして機能する。
- 参考スコア(独自算出の注目度): 23.904569857346605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Can AI reason about a war before its trajectory becomes historically obvious? Analyzing this capability is difficult because retrospective geopolitical prediction is heavily confounded by training-data leakage. We address this challenge through a temporally grounded case study of the early stages of the 2026 Middle East conflict, which unfolded after the training cutoff of current frontier models. We construct 11 critical temporal nodes, 42 node-specific verifiable questions, and 5 general exploratory questions, requiring models to reason only from information that would have been publicly available at each moment. This design substantially mitigates training-data leakage concerns, creating a setting well-suited for studying how models analyze an unfolding crisis under the fog of war, and provides, to our knowledge, the first temporally grounded analysis of LLM reasoning in an ongoing geopolitical conflict. Our analysis reveals three main findings. First, current state-of-the-art large language models often display a striking degree of strategic realism, reasoning beyond surface rhetoric toward deeper structural incentives. Second, this capability is uneven across domains: models are more reliable in economically and logistically structured settings than in politically ambiguous multi-actor environments. Finally, model narratives evolve over time, shifting from early expectations of rapid containment toward more systemic accounts of regional entrenchment and attritional de-escalation. Since the conflict remains ongoing at the time of writing, this work can serve as an archival snapshot of model reasoning during an unfolding geopolitical crisis, enabling future studies without the hindsight bias of retrospective analysis.
- Abstract(参考訳): AIは、その軌道が歴史的に明らかになる前の戦争について理にかなっているだろうか?
トレーニングデータ漏洩によって、振り返りの地政学的な予測が大幅に構築されるため、この機能の分析は困難である。
この課題は、現在のフロンティアモデルのトレーニング遮断後に展開された2026年の中東紛争の初期段階を、時間的に根ざしたケーススタディを通じて解決する。
我々は11の臨界時間ノード、42のノード固有の検証可能な質問、および5つの一般的な探索的な質問を構築し、各時点で公開されていた情報からのみモデルを推論する必要がある。
この設計は、トレーニングデータ漏洩の懸念を軽減し、戦争の霧の下で展開する危機をモデルがどのように分析するかを研究するのに適した設定を作成し、我々の知る限り、現在進行中の地政学的紛争におけるLLM推論の時間的根拠に基づく最初の分析を提供する。
私たちの分析では3つの主な所見が判明した。
第一に、現在の最先端の大規模言語モデルは、しばしば、表面のレトリックを超えて、より深い構造的なインセンティブを推し進める、顕著な戦略的リアリズムを示す。
モデルは、政治的にあいまいなマルチアクター環境よりも、経済的および論理的に構造化された環境においてより信頼性が高い。
最後に、モデル物語は時間とともに進化し、急速な封じ込めの早期の期待から、より体系的な地域拡大と誘惑的脱エスカレーションの説明へと移行した。
論争は執筆時点で継続しているため、この研究は、拡大する地政学的危機におけるモデル推論のアーカイブスナップショットとして機能し、将来の研究は、振り返り分析の後の偏見を伴わない。
関連論文リスト
- Spatial Causal Prediction in Video [56.22332198384257]
我々は,空間因果的結果の予測と観察以上の推論をモデルに挑戦する新しい課題パラダイムを導入する。
我々は、様々な視点、シーン、因果方向にまたがる1,181本の動画に2500対のQAペアからなるベンチマークを構築した。
23種類の最先端モデルに関する総合的な実験を通して、人間とモデルの性能の差は時間外挿に制限され、因果的接地は弱かった。
論文 参考訳(メタデータ) (2026-03-04T11:09:39Z) - That's Deprecated! Understanding, Detecting, and Steering Knowledge Conflicts in Language Models for Code Generation [55.78914774437411]
大規模言語モデル(LLM)は、パラメトリック知識とプロンプトに含まれる矛盾する情報との相違に直面して振る舞う。
このような対立を構築・解釈するためのドメインに依存しないフレームワークを提案する。
本研究では, アクティベーションレベルのステアリングが, ランダムベースライン上でのステアリング成功率を最大12.6%向上させることができることを示す。
論文 参考訳(メタデータ) (2025-10-21T22:27:56Z) - Next-Generation Conflict Forecasting: Unleashing Predictive Patterns through Spatiotemporal Learning [0.0]
本研究では、3つの異なるタイプの暴力を事前に36ヶ月予測するためのニューラルネットワークアーキテクチャを提案する。
このモデルは確率的分類と回帰タスクを共同で実行し、将来の事象の予測と予測等級を生成する。
警告システム、人道的対応計画、証拠に基づく平和構築イニシアチブのための有望なツールである。
論文 参考訳(メタデータ) (2025-06-08T20:42:29Z) - Time-R1: Towards Comprehensive Temporal Reasoning in LLMs [12.147540725976462]
textitTime-R1は,時間的包括的能力を持つ中規模(3B-パラメータ)の大規模言語モデルを実現するフレームワークである。
Time-R1は、最先端の671B DeepSeek-R1を含む200倍以上のモデルで性能が向上している。
この研究は、思慮深く設計されたプログレッシブRL微調整により、より小さく効率的なモデルで時間的性能を向上できるという強い証拠を提供する。
論文 参考訳(メタデータ) (2025-05-16T13:46:28Z) - Building Damage Assessment in Conflict Zones: A Deep Learning Approach Using Geospatial Sub-Meter Resolution Data [9.146968506196446]
我々は,ウクライナのマリプオール市における,紛争前の画像と紛争後の画像を用いた注釈付きデータセットを構築した。
次に、ゼロショットおよび学習シナリオの両方において、CNNモデルの転送可能性について検討する。
これは、サブメートル分解能画像を用いて戦闘帯の建物損傷を評価する最初の研究である。
論文 参考訳(メタデータ) (2024-10-07T07:26:38Z) - Escalation Risks from Language Models in Military and Diplomatic
Decision-Making [0.0]
この研究は、シミュレーションされたウォーゲームにおいて、複数のAIエージェントの振る舞いを精査することを目的としている。
我々は,これらのエージェントによる行動のエスカレーションのリスクを評価するために,新たなウォーゲームシミュレーションとスコアリングフレームワークを設計する。
我々は、モデルが兵器追跡力学を発達させ、より大きな紛争、そして稀に核兵器の配備に至る傾向があることを観察する。
論文 参考訳(メタデータ) (2024-01-07T07:59:10Z) - It Is Time To Steer: A Scalable Framework for Analysis-driven Attack Graph Generation [50.06412862964449]
アタックグラフ(AG)は、コンピュータネットワークに対するマルチステップ攻撃に対するサイバーリスクアセスメントをサポートする最も適したソリューションである。
現在の解決策は、アルゴリズムの観点から生成問題に対処し、生成が完了した後のみ解析を仮定することである。
本稿では,アナリストがいつでもシステムに問い合わせることのできる新しいワークフローを通じて,従来のAG分析を再考する。
論文 参考訳(メタデータ) (2023-12-27T10:44:58Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。