論文の概要: Can We Test Consciousness Theories on AI? Ablations, Markers, and Robustness
- arxiv url: http://arxiv.org/abs/2512.19155v1
- Date: Mon, 22 Dec 2025 08:52:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.680134
- Title: Can We Test Consciousness Theories on AI? Ablations, Markers, and Robustness
- Title(参考訳): AIで意識理論をテストできるか? アブレーション、マーカー、ロバストネス
- Authors: Yin Jun Phua,
- Abstract要約: 我々は、意識理論をテストするために、合成神経現象学アプローチを用いる。
3つの実験において,これらの理論が相補的な機能的層を記述していることを示す解離を報告した。
GWTはブロードキャスト能力を提供し、HOTは品質管理を提供します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The search for reliable indicators of consciousness has fragmented into competing theoretical camps (Global Workspace Theory (GWT), Integrated Information Theory (IIT), and Higher-Order Theories (HOT)), each proposing distinct neural signatures. We adopt a synthetic neuro-phenomenology approach: constructing artificial agents that embody these mechanisms to test their functional consequences through precise architectural ablations impossible in biological systems. Across three experiments, we report dissociations suggesting these theories describe complementary functional layers rather than competing accounts. In Experiment 1, a no-rewire Self-Model lesion abolishes metacognitive calibration while preserving first-order task performance, yielding a synthetic blindsight analogue consistent with HOT predictions. In Experiment 2, workspace capacity proves causally necessary for information access: a complete workspace lesion produces qualitative collapse in access-related markers, while partial reductions show graded degradation, consistent with GWT's ignition framework. In Experiment 3, we uncover a broadcast-amplification effect: GWT-style broadcasting amplifies internal noise, creating extreme fragility. The B2 agent family is robust to the same latent perturbation; this robustness persists in a Self-Model-off / workspace-read control, cautioning against attributing the effect solely to $z_{\text{self}}$ compression. We also report an explicit negative result: raw perturbational complexity (PCI-A) decreases under the workspace bottleneck, cautioning against naive transfer of IIT-adjacent proxies to engineered agents. These results suggest a hierarchical design principle: GWT provides broadcast capacity, while HOT provides quality control. We emphasize that our agents are not conscious; they are reference implementations for testing functional predictions of consciousness theories.
- Abstract(参考訳): 意識の信頼性のある指標の探索は、競合する理論的キャンプ(Global Workspace Theory (GWT)、Integrated Information Theory (IIT)、Higher-Order Theories (HOT))に分断され、それぞれ異なるニューラルシグネチャを提案している。
我々は,これらの機構を具現化した人工エージェントを構築し,生物学的システムでは不可能な正確な構造的改善を通じて機能的結果をテストする,合成神経現象学アプローチを採用する。
3つの実験で、これらの理論が競合するアカウントではなく相補的な機能層を記述していることを示す解離を報告した。
実験1では、非リワイヤ自己モデル病変は、一階タスク性能を維持しながら、メタ認知的校正を廃止し、HOT予測と整合した合成視覚アナログを生成する。
完全なワークスペース障害はアクセス関連マーカーの質的な崩壊を生じさせ、部分的な削減はGWTの点火フレームワークと整合した段階的な劣化を示します。
GWTスタイルのブロードキャストは内部のノイズを増幅し、極端な脆弱性を生み出します。
この堅牢性は、Self-Model-off / workspace-readコントロールで持続し、$z_{\text{self}}$圧縮にのみ影響しないよう警告する。
また, 作業空間のボトルネック下では, 生摂動複雑度 (PCI-A) が減少し, IIT-adjacent proxies が人工エージェントに導入されることを警告した。
GWTはブロードキャスト能力を提供し、HOTは品質管理を提供します。
我々は,エージェントが意識的ではないことを強調し,意識理論の関数的予測をテストするための参照実装である。
関連論文リスト
- Managing Ambiguity: A Proof of Concept of Human-AI Symbiotic Sense-making based on Quantum-Inspired Cognitive Mechanism of Rogue Variable Detection [39.146761527401424]
この研究は、あいまいさを一級構成とすることで管理理論に寄与する。
VUCA環境における組織的レジリエンスに対する人間-AI共生の実践的価値を示す。
論文 参考訳(メタデータ) (2025-12-17T11:23:18Z) - DODO: Causal Structure Learning with Budgeted Interventions [1.0323063834827415]
本稿では,エージェントが環境の因果構造を自律的に学習する方法を定義するアルゴリズムであるDODOを紹介する。
その結果,最も限られた資源条件を除いて,観測的アプローチに比べ,DODOの性能は向上した。
論文 参考訳(メタデータ) (2025-10-09T13:32:33Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - Mutual Information Tracks Policy Coherence in Reinforcement Learning [0.0]
強化学習(RL)エージェントは、センサの故障、アクチュエータの摩耗、環境変化による劣化に直面している。
本稿では,RLの基本動力学を両立させる情報理論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-12T17:24:20Z) - Probabilistic Modeling of Latent Agentic Substructures in Deep Neural Networks [7.4145864319417285]
ニューラルモデルに対する確率論的モデリングに基づくインテリジェントエージェンシーの理論を開発する。
線形プールや連立結果空間では厳密な一様性は不可能であるが、3つ以上の結果が得られる。
論文 参考訳(メタデータ) (2025-09-08T13:55:01Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Understanding, Predicting and Better Resolving Q-Value Divergence in
Offline-RL [86.0987896274354]
まず、オフラインRLにおけるQ値推定のばらつきの主な原因として、基本パターン、自己励起を同定する。
そこで本研究では,Q-network の学習における進化特性を測定するために,SEEM(Self-Excite Eigen Value Measure)尺度を提案する。
われわれの理論では、訓練が早期に発散するかどうかを確実に決定できる。
論文 参考訳(メタデータ) (2023-10-06T17:57:44Z) - A Robust Backpropagation-Free Framework for Images [47.97322346441165]
画像データに対するエラーカーネル駆動型アクティベーションアライメントアルゴリズムを提案する。
EKDAAは、ローカルに派生したエラー送信カーネルとエラーマップを導入することで達成される。
結果は、識別不能なアクティベーション機能を利用するEKDAAトレーニングCNNに対して提示される。
論文 参考訳(メタデータ) (2022-06-03T21:14:10Z) - Drug-Drug Interaction Prediction with Wasserstein Adversarial
Autoencoder-based Knowledge Graph Embeddings [22.562175708415392]
薬物・薬物相互作用のための知識グラフ埋め込みフレームワークを提案する。
本フレームワークでは, 高品質な負のサンプルを生成するために, オートエンコーダを用いる。
判別器は、正三重項と負三重項の両方に基づいて薬物と相互作用の埋め込みを学習する。
論文 参考訳(メタデータ) (2020-04-15T21:03:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。