論文の概要: Support Sufficiency as Consequence-Sensitive Compression in Belief Arbitration
- arxiv url: http://arxiv.org/abs/2604.16434v1
- Date: Mon, 06 Apr 2026 18:28:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.996211
- Title: Support Sufficiency as Consequence-Sensitive Compression in Belief Arbitration
- Title(参考訳): 信念仲裁におけるコンシークエンス・センシティブ圧縮としての支援機能
- Authors: Mark Walsh,
- Abstract要約: システムが仮説にコミットすると、そのコミットメントの背後にある明らかな構造の多くは圧縮に失われます。
標準アカウントは、選択されたコンテンツとスカラーの信頼度が下流制御に十分であると仮定する。
本研究では,実効性制約場が候補に対する仮説幾何を共同で決定する再帰的仲裁アーキテクチャを開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When a system commits to a hypothesis, much of the evidential structure behind that commitment is lost to compression. Standard accounts assume that selected content and scalar confidence suffice for downstream control. This paper argues that they do not, and that determining what must survive compression is itself a consequence-sensitive problem. We develop a recurrent arbitration architecture in which active constraint fields jointly determine a hypothesis geometry over candidates. Rather than carrying that geometry forward in full, the system compresses it into a support-aware control state whose resolution is regulated by current consequence geometry, arbitration memory, and resource constraints. A bounded objective formalizes the tradeoff. Too little retained support collapses policy-relevant distinctions, producing controllers that select content adequately while misrouting verification, abstention, and recovery. Too much retained support fragments learning across overly fine contexts, degrading adaptation even as discrimination improves. These failure modes yield ordered controller predictions confirmed by a minimal repeated-interaction simulation. Adaptive controllers that regulate support resolution outperform all fixed-resolution controllers in cumulative utility. Agile adaptive control outperforms sluggish adaptive control. Fixed high-resolution control achieves the best commitment accuracy but still trails adaptive controllers because resource cost and learning fragmentation offset the gains from richer retention. Support sufficiency should be understood not as a static representational threshold, but as a dynamic compression criterion. Robust arbitration depends on preserving the smallest support structure adequate for policy under the current consequence landscape, and on regulating that structure as conditions change across repeated cycles of inference and action.
- Abstract(参考訳): システムが仮説にコミットすると、そのコミットメントの背後にある明らかな構造の多くは圧縮に失われます。
標準アカウントは、選択されたコンテンツとスカラーの信頼度が下流制御に十分であると仮定する。
本稿は, 圧縮を生き残らなければならないものを決定することは, それ自体は結果に敏感な問題である,と論じる。
本研究では,実効性制約場が候補に対する仮説幾何を共同で決定する再帰的仲裁アーキテクチャを開発する。
システムは、その幾何をフルに転送する代わりに、現在の結果幾何学、調停メモリ、リソース制約によって解像度が制御されるサポート対応制御状態に圧縮する。
有界な目的がトレードオフを形式化する。
サポートの維持が少なすぎると、ポリシー関連の区別が崩壊し、検証、棄権、回復を誤認しながらコンテンツを適切に選択するコントローラが生成される。
過度に細かい文脈で学習するサポートフラグメントが多すぎると、差別が改善しても適応が低下する。
これらの障害モードは、最小限の繰り返し相互作用シミュレーションによって確認された順序付きコントローラ予測をもたらす。
サポート解像度を制御する適応コントローラは、累積ユーティリティですべての固定解像度コントローラより優れている。
アジャイル適応制御は、ゆるやかな適応制御よりも優れています。
固定された高解像度制御は、最高のコミットメント精度を達成するが、リソースコストと学習の断片化により、よりリッチな保持から得られる利益を相殺するため、適応型コントローラを追従する。
サポート十分性は静的な表現しきい値ではなく、動的圧縮基準として理解されるべきである。
ロバスト仲裁は、現在の結果のランドスケープの下でポリシーに適切な最小の支持構造を保存することと、推論と行動の繰り返しサイクルで条件が変化するように構造を規制することに依存する。
関連論文リスト
- Explicit Dropout: Deterministic Regularization for Transformer Architectures [55.09895958546215]
ドロップアウトはディープラーニングにおいて広く使われている正規化手法であるが、その効果は一般的にマスキングによって実現される。
トレーニング損失に直接組み込まれた加算正則化器としてドロップアウトを表現する決定論的定式化を提案する。
論文 参考訳(メタデータ) (2026-04-22T12:45:51Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - Four-Axis Decision Alignment for Long-Horizon Enterprise AI Agents [0.0]
長期のエンタープライズエージェントは、失われた記憶、多段階の推論、および規制の制約の下で高い評価を下す。
長距離決定行動は、4つの軸に分解され、それぞれ独立に測定可能で、フェール可能となる。
論文 参考訳(メタデータ) (2026-04-21T13:37:19Z) - Authority-Level Priors: An Under-Specified Constraint in Hierarchical Predictive Processing [0.0]
オーソリティ・レベル優先(英: Authority-Level Priors、ALP)は、アイデンティティレベルの仮説の規制が許容できるサブセットを定義するメタ構造制約である。
ALPは、追加の表現状態や精度よりも高優先度であり、規制制御に許容される仮説を制約している。
計算形式化は、認可された仮説によって生成されるポリシーに対するポリシー最適化を制限する。
論文 参考訳(メタデータ) (2026-03-19T13:27:47Z) - DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding [59.16244104797919]
本稿では,リスク制約付き復号法(DARC)*による分散アライメント(Disagreement-Aware Alignment)を提案する。
DARCは応答選択を、分布的に堅牢で、リスクに敏感な意思決定として捉えている。
アライメントベンチマークの実験では、DARCは競合平均品質を維持しながら、不一致と尾のリスクを低減する。
論文 参考訳(メタデータ) (2026-03-09T09:21:29Z) - Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification [14.911955979675772]
我々は,グローバルな形状マッチングからサポートカバレッジへパラダイムをシフトさせるアンコレッドポリシー最適化(APO)を提案する。
APOは精度と多様性のトレードオフを破り、Pass@1を大幅に改善します。
論文 参考訳(メタデータ) (2026-02-05T14:41:57Z) - On Geometric Structures for Policy Parameterization in Continuous Control [7.056222499095849]
本稿では,単位多様体上での演算による構造的利点を保った,計算効率の良いアクション生成パラダイムを提案する。
本手法は,動作を決定論的方向ベクトルと学習可能な濃度に分解し,目標方向と一様雑音との効率性を実現する。
実証的に、我々の手法は標準的な連続制御ベンチマークで最先端の手法と一致するか超えている。
論文 参考訳(メタデータ) (2025-11-11T13:32:38Z) - Prediction-Powered Communication with Distortion Guarantees [65.37485275954224]
本研究では,デバイスが厳密な歪み保証付きゼロ遅延制約の下で通信する,予測駆動型通信環境について検討する。
本稿では,オンラインコンフォメーション予測を利用した2つのゼロ遅延圧縮アルゴリズムを提案する。
セマンティックテキスト圧縮の実験は、そのアプローチを検証し、ビットレートの大幅な削減を示す。
論文 参考訳(メタデータ) (2025-09-29T07:19:39Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。