論文の概要: The Subject of Emergent Misalignment in Superintelligence: An Anthropological, Cognitive Neuropsychological, Machine-Learning, and Ontological Perspective
- arxiv url: http://arxiv.org/abs/2512.17989v1
- Date: Fri, 19 Dec 2025 17:43:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.143737
- Title: The Subject of Emergent Misalignment in Superintelligence: An Anthropological, Cognitive Neuropsychological, Machine-Learning, and Ontological Perspective
- Title(参考訳): 超知能の創発的相違 : 人類学的・認知神経心理学的・マシンラーニング的・オントロジー的視点
- Authors: Muhammad Osama Imran, Roshni Lulla, Rodney Sappington,
- Abstract要約: 我々は超知能談話を通して、欠席した人間の主題、そして「AI無意識」の未発達理論を見いだす。
人間の被験者は、この想像のどの場所に住んでいますか?
望ましくないパターンが私たちの存在に固有の場合に、これらのエージェントが偽りの戦略を選択することを非難するだろうか?
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We examine the conceptual and ethical gaps in current representations of Superintelligence misalignment. We find throughout Superintelligence discourse an absent human subject, and an under-developed theorization of an "AI unconscious" that together are potentiality laying the groundwork for anti-social harm. With the rise of AI Safety that has both thematic potential for establishing pro-social and anti-social potential outcomes, we ask: what place does the human subject occupy in these imaginaries? How is human subjecthood positioned within narratives of catastrophic failure or rapid "takeoff" toward superintelligence? On another register, we ask: what unconscious or repressed dimensions are being inscribed into large-scale AI models? Are we to blame these agents in opting for deceptive strategies when undesirable patterns are inherent within our beings? In tracing these psychic and epistemic absences, our project calls for re-centering the human subject as the unstable ground upon which the ethical, unconscious, and misaligned dimensions of both human and machinic intelligence are co-constituted. Emergent misalignment cannot be understood solely through technical diagnostics typical of contemporary machine-learning safety research. Instead, it represents a multi-layered crisis. The human subject disappears not only through computational abstraction but through sociotechnical imaginaries that prioritize scalability, acceleration, and efficiency over vulnerability, finitude, and relationality. Likewise, the AI unconscious emerges not as a metaphor but as a structural reality of modern deep learning systems: vast latent spaces, opaque pattern formation, recursive symbolic play, and evaluation-sensitive behavior that surpasses explicit programming. These dynamics necessitate a reframing of misalignment as a relational instability embedded within human-machine ecologies.
- Abstract(参考訳): 本稿では,超知能不整合の現在の表現における概念的・倫理的ギャップについて考察する。
我々は超知能談話を通して、欠落した人間の主題を語り、同時に「AI無意識」の未熟な理論化が、反社会的危害の基盤となる可能性を秘めているのを見いだす。
AIセーフティの台頭は、社会擁護と反社会的潜在的な結果を確立するためのテーマ的な可能性の両方を持っているので、私たちは質問する。
破滅的な失敗や超知能への迅速な「離陸」という物語の中で、人間の主観はどのように位置づけられているか?
大規模なAIモデルに無意識または抑圧された次元が刻まれているのか?
望ましくないパターンが私たちの存在に固有の場合に、これらのエージェントが偽りの戦略を選択することを非難するだろうか?
これらの精神・てんかんの欠如を追究するために、我々のプロジェクトは、人間と機械の知性の倫理的、無意識的、不整合した次元が共に構成される不安定な基盤として、人間の対象を再中心化することを求めている。
創発的なミスアライメントは、現代の機械学習安全研究に典型的な技術的診断によってのみ理解できない。
むしろそれは、多層的危機を表している。
人間の主題は、計算抽象化だけでなく、スケーラビリティ、加速、そして脆弱性、有限性、リレーショナル性よりも効率を優先する社会技術的想像を通じて消滅する。
同様に、AI無意識はメタファーとしてではなく、巨大な潜在空間、不透明なパターン形成、再帰的シンボリックプレイ、明示的なプログラミングを超えた評価に敏感な行動といった、現代のディープラーニングシステムの構造的現実として現れます。
これらのダイナミクスは、人間と機械のエコロジーに埋め込まれた関係不安定性として、不整合の再フレーミングを必要とする。
関連論文リスト
- What Does 'Human-Centred AI' Mean? [0.0]
AIは、テクノロジーと人間との関係として有用である。
あらゆるAIは人間の認知に関係している。
AIをフェティシシーから脱却するためには、目の中の人間の目を見る必要がある。
論文 参考訳(メタデータ) (2025-07-26T14:18:52Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [78.61382193420914]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Analyzing Advanced AI Systems Against Definitions of Life and Consciousness [0.0]
先進的なAIシステムが意識を得たかどうかを調べるための指標をいくつか提案する。
我々は、サボタージュ防御、ミラー自己認識アナログ、メタ認知更新のような免疫を発現する十分に高度なアーキテクチャが、ライフライクまたは意識ライクな特徴に似た重要なしきい値を超えた可能性があることを示唆している。
論文 参考訳(メタデータ) (2025-02-07T15:27:34Z) - Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
我々は人間の知恵について知られているものを調べ、そのAIのビジョンをスケッチする。
AIシステムは特にメタ認知に苦しむ。
スマートAIのベンチマーク、トレーニング、実装について論じる。
論文 参考訳(メタデータ) (2024-11-04T18:10:10Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - Modelos din\^amicos aplicados \`a aprendizagem de valores em
intelig\^encia artificial [0.0]
この地域の数人の研究者が、人間と環境の保存のための堅牢で有益な、安全なAIの概念を開発した。
人工知能エージェントが人間の価値観に合わせた価値を持っていることは、最も重要である。
おそらくこの難しさは、認知的手法を使って価値を表現するという問題に対処する方法から来ています。
論文 参考訳(メタデータ) (2020-07-30T00:56:11Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z) - Dynamic Cognition Applied to Value Learning in Artificial Intelligence [0.0]
この分野の数人の研究者が、堅牢で有益で安全な人工知能の概念を開発しようとしている。
人工知能エージェントが人間の価値観に合わせた価値を持っていることは、最も重要である。
この問題に対する可能なアプローチは、SEDのような理論モデルを使用することである。
論文 参考訳(メタデータ) (2020-05-12T03:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。