論文の概要: The Subject of Emergent Misalignment in Superintelligence: An Anthropological, Cognitive Neuropsychological, Machine-Learning, and Ontological Perspective
- arxiv url: http://arxiv.org/abs/2512.17989v1
- Date: Fri, 19 Dec 2025 17:43:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.143737
- Title: The Subject of Emergent Misalignment in Superintelligence: An Anthropological, Cognitive Neuropsychological, Machine-Learning, and Ontological Perspective
- Title(参考訳): 超知能の創発的相違 : 人類学的・認知神経心理学的・マシンラーニング的・オントロジー的視点
- Authors: Muhammad Osama Imran, Roshni Lulla, Rodney Sappington,
- Abstract要約: 我々は超知能談話を通して、欠席した人間の主題、そして「AI無意識」の未発達理論を見いだす。
人間の被験者は、この想像のどの場所に住んでいますか?
望ましくないパターンが私たちの存在に固有の場合に、これらのエージェントが偽りの戦略を選択することを非難するだろうか?
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We examine the conceptual and ethical gaps in current representations of Superintelligence misalignment. We find throughout Superintelligence discourse an absent human subject, and an under-developed theorization of an "AI unconscious" that together are potentiality laying the groundwork for anti-social harm. With the rise of AI Safety that has both thematic potential for establishing pro-social and anti-social potential outcomes, we ask: what place does the human subject occupy in these imaginaries? How is human subjecthood positioned within narratives of catastrophic failure or rapid "takeoff" toward superintelligence? On another register, we ask: what unconscious or repressed dimensions are being inscribed into large-scale AI models? Are we to blame these agents in opting for deceptive strategies when undesirable patterns are inherent within our beings? In tracing these psychic and epistemic absences, our project calls for re-centering the human subject as the unstable ground upon which the ethical, unconscious, and misaligned dimensions of both human and machinic intelligence are co-constituted. Emergent misalignment cannot be understood solely through technical diagnostics typical of contemporary machine-learning safety research. Instead, it represents a multi-layered crisis. The human subject disappears not only through computational abstraction but through sociotechnical imaginaries that prioritize scalability, acceleration, and efficiency over vulnerability, finitude, and relationality. Likewise, the AI unconscious emerges not as a metaphor but as a structural reality of modern deep learning systems: vast latent spaces, opaque pattern formation, recursive symbolic play, and evaluation-sensitive behavior that surpasses explicit programming. These dynamics necessitate a reframing of misalignment as a relational instability embedded within human-machine ecologies.
- Abstract(参考訳): 本稿では,超知能不整合の現在の表現における概念的・倫理的ギャップについて考察する。
我々は超知能談話を通して、欠落した人間の主題を語り、同時に「AI無意識」の未熟な理論化が、反社会的危害の基盤となる可能性を秘めているのを見いだす。
AIセーフティの台頭は、社会擁護と反社会的潜在的な結果を確立するためのテーマ的な可能性の両方を持っているので、私たちは質問する。
破滅的な失敗や超知能への迅速な「離陸」という物語の中で、人間の主観はどのように位置づけられているか?
大規模なAIモデルに無意識または抑圧された次元が刻まれているのか?
望ましくないパターンが私たちの存在に固有の場合に、これらのエージェントが偽りの戦略を選択することを非難するだろうか?
これらの精神・てんかんの欠如を追究するために、我々のプロジェクトは、人間と機械の知性の倫理的、無意識的、不整合した次元が共に構成される不安定な基盤として、人間の対象を再中心化することを求めている。
創発的なミスアライメントは、現代の機械学習安全研究に典型的な技術的診断によってのみ理解できない。
むしろそれは、多層的危機を表している。
人間の主題は、計算抽象化だけでなく、スケーラビリティ、加速、そして脆弱性、有限性、リレーショナル性よりも効率を優先する社会技術的想像を通じて消滅する。
同様に、AI無意識はメタファーとしてではなく、巨大な潜在空間、不透明なパターン形成、再帰的シンボリックプレイ、明示的なプログラミングを超えた評価に敏感な行動といった、現代のディープラーニングシステムの構造的現実として現れます。
これらのダイナミクスは、人間と機械のエコロジーに埋め込まれた関係不安定性として、不整合の再フレーミングを必要とする。
関連論文リスト
- The Psychology of Learning from Machines: Anthropomorphic AI and the Paradox of Automation in Education [1.8217623940980625]
この研究は、4つの研究伝統を合成し、学習者が人間型AI教師と心理的にどう関係するかを理解するための包括的な枠組みを確立する。
我々は、ジェネレーティブAIの会話流布によって強化された3つの永続的課題を特定する。
われわれはこの理論合成を、AIによる哲学的議論と人間によるエンジニアリングチュートリアルにまたがって、104,984件のYouTubeコメントの比較分析を通じて基礎づけている。
論文 参考訳(メタデータ) (2026-01-07T08:28:33Z) - AI Deception: Risks, Dynamics, and Controls [153.71048309527225]
このプロジェクトは、AI偽装分野の包括的で最新の概要を提供する。
我々は、動物の偽装の研究からシグナル伝達理論に基づく、AI偽装の正式な定義を同定する。
我々は,AI偽装研究の展望を,偽装発生と偽装処理の2つの主要な構成要素からなる偽装サイクルとして整理する。
論文 参考訳(メタデータ) (2025-11-27T16:56:04Z) - Mind Meets Space: Rethinking Agentic Spatial Intelligence from a Neuroscience-inspired Perspective [53.556348738917166]
エージェントAIの最近の進歩は、自律的なタスク実行と言語に基づく推論が可能なシステムにつながっている。
人間の空間知能は、統合された多感覚知覚、空間記憶、認知マップに根ざし、非構造環境における柔軟でコンテキスト対応の意思決定を可能にする。
論文 参考訳(メタデータ) (2025-09-11T05:23:22Z) - What Does 'Human-Centred AI' Mean? [0.0]
AIは、テクノロジーと人間との関係として有用である。
あらゆるAIは人間の認知に関係している。
AIをフェティシシーから脱却するためには、目の中の人間の目を見る必要がある。
論文 参考訳(メタデータ) (2025-07-26T14:18:52Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [78.61382193420914]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Analyzing Advanced AI Systems Against Definitions of Life and Consciousness [0.0]
先進的なAIシステムが意識を得たかどうかを調べるための指標をいくつか提案する。
我々は、サボタージュ防御、ミラー自己認識アナログ、メタ認知更新のような免疫を発現する十分に高度なアーキテクチャが、ライフライクまたは意識ライクな特徴に似た重要なしきい値を超えた可能性があることを示唆している。
論文 参考訳(メタデータ) (2025-02-07T15:27:34Z) - Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
我々は人間の知恵について知られているものを調べ、そのAIのビジョンをスケッチする。
AIシステムは特にメタ認知に苦しむ。
スマートAIのベンチマーク、トレーニング、実装について論じる。
論文 参考訳(メタデータ) (2024-11-04T18:10:10Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Modelos din\^amicos aplicados \`a aprendizagem de valores em
intelig\^encia artificial [0.0]
この地域の数人の研究者が、人間と環境の保存のための堅牢で有益な、安全なAIの概念を開発した。
人工知能エージェントが人間の価値観に合わせた価値を持っていることは、最も重要である。
おそらくこの難しさは、認知的手法を使って価値を表現するという問題に対処する方法から来ています。
論文 参考訳(メタデータ) (2020-07-30T00:56:11Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z) - Dynamic Cognition Applied to Value Learning in Artificial Intelligence [0.0]
この分野の数人の研究者が、堅牢で有益で安全な人工知能の概念を開発しようとしている。
人工知能エージェントが人間の価値観に合わせた価値を持っていることは、最も重要である。
この問題に対する可能なアプローチは、SEDのような理論モデルを使用することである。
論文 参考訳(メタデータ) (2020-05-12T03:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。