論文の概要: Architectural Wisdom: A Framework for Governing Optimization in AI Systems
- arxiv url: http://arxiv.org/abs/2606.16319v1
- Date: Mon, 15 Jun 2026 07:27:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.1426
- Title: Architectural Wisdom: A Framework for Governing Optimization in AI Systems
- Title(参考訳): アーキテクチャの知恵:AIシステムの最適化を克服するためのフレームワーク
- Authors: Edward Y. Chang,
- Abstract要約: 現代のAIは、機能拡張だけでは確実に修正できない構造的失敗を示す。
この失敗は知恵の問題であって、知性の問題ではない、と私たちは主張する。
我々は「知恵」を故意に建築的な意味で使用し、美徳、意識、道徳的全知の主張として使用しない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern AI systems exhibit structural failures that capability scaling alone does not reliably fix: they optimize under-specified objectives with no architectural mechanism to question whether the objective should be optimized at all. Engagement maximization can amplify harmful pathways; tool-using agents can commit irreversible actions; preference-trained language models can become sycophantic. We argue that this failure is a wisdom problem, not an intelligence problem. We use "wisdom" in a deliberately architectural sense, not as a claim about virtue, consciousness, or moral omniscience. Intelligence accepts a goal and optimizes within it; wisdom interrogates whether the goal should be optimized at all. The two are separable architectural properties. We propose architectural wisdom as a corrigible objective-governance layer above the optimization substrate. The layer makes three structural commitments explicit and nondegenerate before any action: temporal horizon, relational boundary, and irreversibility. It is realized by four components (Structural Utility Transform, Moral Admissibility Interface, Arbitration and Escalation Controller, Value Revision Channel) that compute a six-coordinate wisdom tuple over horizon, relational coverage, irreversibility, admissibility, value revision, and auditability. We motivate the architecture by eight cases drawn from contemporary AI failures, secular wisdom traditions, and hard ethical situations, and defend the distinction against the intelligence-completeness thesis using goal-questioning over goal-taking, Bostrom's orthogonality, structural separation in our exemplar cases, and persistent failure modes despite capability scaling. The framework is the conceptual contract for a larger architecture whose formal specifications and empirical validation are developed in subsequent work.
- Abstract(参考訳): 最新のAIシステムは、機能拡張だけでは確実に修正されない構造的障害を示す。
エンゲージメントの最大化は有害な経路を増幅し、ツール・ユース・エージェントは不可逆的な行動を起こすことができる。
この失敗は知恵の問題であって、知性の問題ではない、と私たちは主張する。
我々は「知恵」を故意に建築的な意味で使用し、美徳、意識、道徳的全知の主張として使用しない。
知性は目標を受け入れ、その内部で最適化する。
2つは分離可能な建築特性である。
本稿では,最適化基板上の客観支配層としてアーキテクチャの知恵を提案する。
この層は、時間的水平線、リレーショナル境界、および不可逆性の3つの構造的コミットメントを、何らかの作用の前に明示的かつ非退化させる。
それは、水平線、リレーショナルカバレッジ、不可逆性、許容性、価値リビジョン、監査性に関する6つのコーディネートな知恵を演算する4つのコンポーネント(構造的ユーティリティ変換、モラル適応インターフェイス、アービテーションとエスカレーションコントローラ、バリューリビジョンチャンネル)によって実現される。
我々は、現代のAIの失敗、世俗的な知恵の伝統、ハード倫理的な状況から引き出された8つのケースによってアーキテクチャを動機付け、ゴールテイクに対するゴールクエスト、ボストロムの直交性、我々の典型的なケースにおける構造的分離、能力スケーリングにかかわらず永続的な障害モードを用いて、知能完全性理論の区別を守ります。
このフレームワークは、正式な仕様と実証的な検証がその後の作業で開発されたより大きなアーキテクチャの概念的な契約である。
関連論文リスト
- Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution [80.98492754957466]
公正性、堅牢性、プライバシ、説明可能性といった、信頼性の高いAI目標を同時に達成することは難しい。
本稿では、パフォーマンスにおけるトレードオフを理解しバランスをとるためには因果性が必要であると論じ、信頼できるAIの複数の目的について論じる。
論文 参考訳(メタデータ) (2026-05-04T14:26:28Z) - When Agents Evolve, Institutions Follow [52.359340707289114]
大規模言語モデル上に構築されたマルチエージェントシステムは、同じ課題に直面している。
彼らの中心的な問題は、個人の知性だけでなく、集団的な組織である。
我々は,4つの標準的ガバナンスパターンにまたがる7つの歴史的政治機関を,実行可能なマルチエージェントアーキテクチャに翻訳する。
論文 参考訳(メタデータ) (2026-04-30T10:30:58Z) - The Missing Knowledge Layer in Cognitive Architectures for AI Agents [0.0]
AIエージェントのための最も影響力のある2つの認知アーキテクチャフレームワーク、CoALAとJEPAはどちらも、独自の永続化セマンティクスを備えた明示的な知識層を欠いている。
そこで我々は,各層が基本的に異なるパーシステンス・セマンティクスを持つ4層デコン位置(知識,記憶,知性,知性)を提案する。
これらの区別は、エンジニアリング実装において異なるパーシステンス・セマンティクスを必要としており、現在のフレームワークやシステムがこれを提供していない、と我々は主張する。
論文 参考訳(メタデータ) (2026-04-13T12:05:30Z) - Toward a Theory of Agents as Tool-Use Decision-Makers [89.26889709510242]
真の自律性は、エージェントが、彼らが知っていること、必要なこと、そしてその知識を効率的に獲得する方法を統治する、一貫性のある疫学の枠組みに根ざす必要がある、と我々は主張する。
本研究では,内的推論と外的行動を等価な疫学ツールとして扱う統一理論を提案し,エージェントが内観と相互作用を体系的に調整することを可能にする。
この視点は、エージェントの設計を単なるアクションエグゼクタから知識駆動インテリジェンスシステムにシフトさせ、適応的で効率的でゴール指向の行動が可能な基礎エージェントを構築するための原則化された道筋を提供する。
論文 参考訳(メタデータ) (2025-06-01T07:52:16Z) - Cognitive Silicon: An Architectural Blueprint for Post-Industrial Computing Systems [0.0]
本稿では2035年に向けて提案された仮想的なフルスタックアーキテクチャフレームワークについて,認知コンピューティングシステム設計の軌道を探究する。
提案したアーキテクチャは、シンボリックなスキャフォールディング、管理されたメモリ、実行時のモラルコヒーレンス、シリコンとセマンティック層間のアライメント対応実行を統合する。
論文 参考訳(メタデータ) (2025-04-23T11:24:30Z) - Contemplative Artificial Intelligence [1.6591901705380634]
我々は、AIシステムにレジリエントなWise World Modelを組み込むことができる4つの公理原理を示す。
第一にマインドフルネスは、創発的なサブゴールの自己監視と再調整を可能にする。
第二に、空の森は犬のゴールを固定し、厳格な事前を緩和する。
第三に、非二重性は敵の自己他の境界を解消する。
第4に、無制限のケアは、苦しみの普遍的な減少を動機づける。
論文 参考訳(メタデータ) (2025-04-21T14:20:49Z) - Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
我々は人間の知恵について知られているものを調べ、そのAIのビジョンをスケッチする。
AIシステムは特にメタ認知に苦しむ。
スマートAIのベンチマーク、トレーニング、実装について論じる。
論文 参考訳(メタデータ) (2024-11-04T18:10:10Z) - Hierarchical Invariance for Robust and Interpretable Vision Tasks at Larger Scales [54.78115855552886]
本稿では、畳み込みニューラルネットワーク(CNN)のような階層型アーキテクチャを用いて、オーバーコンプリート不変量を構築する方法を示す。
オーバーコンプリート性により、そのタスクはニューラルアーキテクチャサーチ(NAS)のような方法で適応的に形成される。
大規模で頑健で解釈可能な視覚タスクの場合、階層的不変表現は伝統的なCNNや不変量に対する効果的な代替物とみなすことができる。
論文 参考訳(メタデータ) (2024-02-23T16:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。