論文の概要: Grounding Before Generalizing: How AI Differs from Humans in Causal Transfer
- arxiv url: http://arxiv.org/abs/2604.24062v1
- Date: Mon, 27 Apr 2026 05:37:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.75487
- Title: Grounding Before Generalizing: How AI Differs from Humans in Causal Transfer
- Title(参考訳): AIがいかに人間から距離を逸脱するか
- Authors: Liangru Xiang, Yuxi Ma, Zhihao Cao, Yixin Zhu, Song-Chun Zhu,
- Abstract要約: 本研究では,現在最先端のAIモデルが抽象因果構造伝達のためのヒューマンライクなメカニズムを持っているかを検討する。
本研究は, 共通原因 (CC) と共通効果 (CE) 構造が根本的に遅延または欠落していることを示す。
これらの結果から、大規模統計学習は、人間の類推的推論を支える非文脈化された因果関係を創出しないことが明らかとなった。
- 参考スコア(独自算出の注目度): 47.76679214811589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting abstract causal structures and applying them to novel situations is a hallmark of human intelligence. While Large Language Models (LLMs) and Vision Language Models (VLMs) have shown strong performance on a wide range of reasoning tasks, their capacity for interactive causal learning -- inducing latent structures through sequential exploration and transferring them across contexts -- remains uncharacterized. Human learners accomplish such transfer after minimal exposure, whereas classical Reinforcement Learning (RL) agents fail catastrophically. Whether state-of-the-art Artificial Intelligence (AI) models possess human-like mechanisms for abstract causal structure transfer is an open question. Using the OpenLock paradigm requiring sequential discovery of Common Cause (CC) and Common Effect (CE) structures, here we show that models exhibit fundamentally delayed or absent transfer: even successful models require initial environmental-specific mapping -- what we term environmental grounding -- before efficiency gains emerge, whereas humans leverage prior structural knowledge from the very first solution attempt. In the text-only condition, models matched or exceeded human discovery efficiency. In contrast, visual information -- in both the image-only and text-and-image conditions -- overall degraded rather than enhanced performance, revealing a broad reliance on symbolic processing rather than integrated multimodal reasoning. Models further exhibited systematic CC/CE asymmetries absent in humans, suggesting heuristic biases rather than direction-neutral causal abstraction. These findings reveal that large-scale statistical learning does not produce the decontextualized causal schemas underpinning human analogical reasoning, establishing grounding-dependent transfer as a fundamental limitation of current LLMs and VLMs.
- Abstract(参考訳): 抽象的な因果構造を抽出し、それらを新しい状況に適用することは、人間の知性の目印である。
大規模言語モデル(LLMs)とビジョン言語モデル(VLMs)は、幅広い推論タスクにおいて強力なパフォーマンスを示しているが、対話型因果学習(Interactive causal learning)の能力は、逐次的な探索とコンテキスト間の移動を通じて遅延構造を誘導する。
従来の強化学習(RL)エージェントは破滅的に失敗する。
最先端人工知能(AI)モデルが抽象因果構造伝達のための人間ライクなメカニズムを持っているかどうかは、未解決の問題である。
ここでは、共通原因(CC)と共通効果(CE)構造を逐次発見する必要があるOpenLockパラダイムを用いて、モデルが根本的な遅延または欠落を示すことを示す。
テキストのみの状態では、モデルは人間の発見効率にマッチするか、超えた。
対照的に、視覚情報 -- 画像のみとテキストと画像の両方の条件 -- は全般的にパフォーマンスの向上よりも劣化し、統合マルチモーダル推論よりもシンボル処理に大きく依存していた。
モデルでは、ヒトに存在しない系統的なCC/CE非対称性が示され、方向ニュートラル因果抽象よりもヒューリスティックバイアスが示唆された。
これらの結果から, 大規模統計学習は, ヒトの類推的推論を基盤とした非文脈化因果スキーマを生成せず, 現状のLLMとVLMの基本的な限界として接地依存的移動を確立することが示唆された。
関連論文リスト
- An Alternative Trajectory for Generative AI [4.176445342688645]
本稿では,ドメイン固有超知能に基づく代替トラジェクトリを提案する。
1つの巨大なジェネラリストモデルではなく、我々は「DSSモデルの社会」を想定する。
このパラダイムは、能力をサイズから切り離して、インテリジェンスをエネルギー集約型データセンタから、セキュアなオンデバイスエキスパートに移行することを可能にする。
論文 参考訳(メタデータ) (2026-03-14T22:33:28Z) - Think Visually, Reason Textually: Vision-Language Synergy in ARC [94.15522924153264]
ARC-AGIは、概念ルールの誘導と新しいタスクへの転送のための厳格なテストベッドである。
既存のほとんどの手法は、ARC-AGIを純粋にテキストによる推論タスクとして扱い、人間が視覚的抽象化に強く依存しているという事実を見落としている。
VLSR(Vision-Language Synergy Reasoning)とMSSC(Modality-Switch Self-Correction)の2つの相乗的戦略を導入する。
本研究は,視覚的抽象と言語的推論を一体化させることが,汎用的な人間的な知性を実現するための重要なステップであることを示唆している。
論文 参考訳(メタデータ) (2025-11-19T18:59:04Z) - Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。
最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。
タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文 参考訳(メタデータ) (2024-10-31T12:48:58Z) - Identifiable Causal Representation Learning: Unsupervised, Multi-View, and Multi-Environment [10.814585613336778]
因果表現学習は、機械学習のコアとなる強みと因果性を組み合わせることを目的としている。
この論文は、CRLが直接の監督なしに何が可能であるかを調査し、理論的基礎に寄与する。
論文 参考訳(メタデータ) (2024-06-19T09:14:40Z) - Position: Stop Making Unscientific AGI Performance Claims [6.343515088115924]
人工知能(AI)分野の発展は、人工知能(AGI)の「スパーク」を観察するための「完璧な嵐」を生み出した。
我々は、モデルの潜在空間における有意義なパターンの発見は、AGIを支持する証拠とは見なされないことを議論し、実証的に実証した。
我々は、モデル表現と興味のある変数の間の相関が、モデルが根底にある「真実」の関係について理解していることから「原因」であるとの誤解に対して、AIの方法論的設定と一般的な公開イメージの両方が理想的であると結論付けている。
論文 参考訳(メタデータ) (2024-02-06T12:42:21Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。