論文の概要: CARVE: Certified Affordable Repair of Vetoed Maneuvers via Envelopes for Interactive Driving
- arxiv url: http://arxiv.org/abs/2606.02641v1
- Date: Sun, 31 May 2026 12:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.483688
- Title: CARVE: Certified Affordable Repair of Vetoed Maneuvers via Envelopes for Interactive Driving
- Title(参考訳): CARVE:インタラクティブ運転のためのエンベロープによるベト式マニキュアの高性能修理
- Authors: Yifan Wang,
- Abstract要約: インタラクティブな運転は、ルール対応の自動運転スタックで見逃しやすい障害モードを公開する。
我々は,エゴ所有およびエージェント所有の戦術演算子の有限格子上の予測自由証明層であるCARVEを紹介する。
我々は,証明の健全性,構造的右翼の敬意,厳密な有限格子最小性,フォールバックの緊急性,および非難-一貫性条件を証明した。
- 参考スコア(独自算出の注目度): 6.016090674751934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive driving exposes a failure mode that is easy to miss in rule-aware autonomous-driving stacks: a hard-rule margin can be negative for an ego candidate even though a small lawful accommodation by a non-priority agent would restore feasibility. Existing rulebooks, shields, and reachability filters are strong at vetoing unsafe actions, while prediction-based planners model likely responses. Neither returns a runtime proof object that states which bounded multi-agent edit repairs the maneuver, who owns the edit, whether the request is right-of-way affordable, and what ego fallback remains if the request is not observed. We formulate this missing object as *interactive repair certification* and introduce *CARVE*, a prediction-free certificate layer over a finite lattice of ego-owned and agent-owned tactical operators. Agent-owned requests are admissible only inside \(B_j(s) = β(π_j)α_j^{\max}(s)\), a cooperation envelope that separates kinematic reachability from normative priority. The resulting certificate records the binding rule, repair category, repair set, responsibility-weighted cost split, and fallback. On 589 Lanelet2-geometry-grounded INTERACTION replay episodes, CARVE-Greedy accepts 98.64% of initially vetoed maneuvers and recovers 370/378 human-resolved false vetoes, while preserving 589/589 right-of-way respect, zero priority-agent false positives, and 400/400 negative-stress vetoes. We prove certificate soundness, structural right-of-way respect, exact finite-lattice minimality, fallback contingency, and blame-consistency conditions. CARVE does not predict or require another driver's compliance; it certifies whether a proposed interaction is bounded, attributable, and normatively admissible under declared assumptions.
- Abstract(参考訳): 非プライオリティエージェントによる小さな合法的宿泊施設が実現可能性を取り戻すとしても、厳格な利幅はエゴ候補にとって否定的である。
既存のルールブック、シールド、到達可能性フィルタは、安全でないアクションに拒否権を持つ一方で、予測ベースのプランナーは、おそらく応答をモデル化する。
どちらの境界付きマルチエージェントの編集が操作を修復するか、誰が編集を所有するか、リクエストが手頃な価格であるかどうか、リクエストが観察されていなければエゴのフォールバックが残っているかを記述した実行時証明オブジェクトも返さない。
この欠落したオブジェクトを *interactive repair certification* として定式化し,エゴ所有およびエージェント所有の戦術演算子の有限格子上の予測自由証明層である *CARVE* を導入する。
B_j(s) = β(π_j)α_j^{\max}(s)\ は、運動的到達性を規範的優先度から分離する協調エンベロープである。
得られた証明書は、バインディングルール、修理カテゴリ、修理セット、責任重み付きコスト分割、フォールバックを記録します。
589 Lanelet2-geometry-grounded InterActionのリプレイでは、CARVE-Greedyは、当初拒否された操作の98.64%を受け入れ、370/378人の解決された偽の獣医を回収する一方で、589/589の右派の敬意、ゼロの優先性偽陽性、400/400の負のストレス性獣医を保護している。
我々は,証明の健全性,構造的右翼の敬意,厳密な有限格子最小性,フォールバックの緊急性,および非難-一貫性条件を証明した。
CARVEは、他のドライバーのコンプライアンスを予測したり要求したりしない。
関連論文リスト
- Repair Before Veto: Repair-Augmented Constraint Learning for Contextual Decisions [6.016090674751934]
我々は、既知の修理作業者をセマンティクスに引き上げる文脈決定フレームワークである修復制約学習(RACL)を導入する。
候補者は、手頃な修理が十分に実現可能で好まれる場合に受け入れられる。そうでなければ、システムは構造化された拒絶債権を返却し、適用すれば、修理計画を立てる。
制御されたDB1B由来のベンチマークで、RACLは意図した信用と修復構造を回復する。
論文 参考訳(メタデータ) (2026-06-01T14:38:04Z) - Survive or Collapse: The Asymmetric Roles of Data Gating and Reward Grounding in Self-Play RL [76.45061154544568]
セルフプレイ強化学習は、言語モデルを独自の生成タスクで訓練し、人間ラベルなしでプロジェクタとソルバを共進化させる。
最近のシステムでは強い推理効果が報告されているが、崩壊と不安定性は広く観察され、理解されていない。
代わりに、自己プレイの安定性は、提案者生成タスクがトレーニングプールに入るかを判断するデータレベルゲートと、すでに認められたタスクに関するポリシーを更新する報酬信号の2つの異なるレバーによって管理されていると論じる。
論文 参考訳(メタデータ) (2026-05-21T09:19:23Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - Preregistered Belief Revision Contracts [2.28438857884398]
PBRC(Preregistered Belief Revision Contracts)は,オープン通信と許容可能な変更を分離するプロトコルレベルのメカニズムである。
PBRC契約は、ファーストオーダーのエビデンストリガー、許容可能なリビジョンオペレータ、優先ルール、フォールバックポリシーを公に修正する。
本報告では,信頼軌道と正準化された監査トレースを保存したPBRC正規形式を,監査可能なトリガープロトコルで認めていることを示す。
論文 参考訳(メタデータ) (2026-04-16T22:22:54Z) - Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI [0.0]
責任を負うAIに対して,Brouwerにインスパイアされたアサービビリティ制約を提案する。
ハイテイクドメインでは、公に検査可能でコンテスト可能な権利証明書を提供する場合に限り、システムはクレームを主張または否定することができる。
論文 参考訳(メタデータ) (2026-03-04T12:14:21Z) - To Throw a Stone with Six Birds: On Agents and Agenthood [0.0]
Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
SBT内では,タイプ正当性評価を行う。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する。
論文 参考訳(メタデータ) (2026-02-03T10:46:23Z) - Core Safety Values for Provably Corrigible Agents [2.6451153531057985]
我々は,複数段階の部分的に観察された環境において,検証可能な保証を付与し,適応性のための最初の実装可能なフレームワークを紹介した。
私たちのフレームワークは、単一の報酬を5つの*構造的に分離された*ユーティリティヘッドに置き換えます。
敵がエージェントを修正できるオープンエンド設定では、任意のポストハックエージェントが調整性に反するかどうかを判断することは不可能である。
論文 参考訳(メタデータ) (2025-07-28T16:19:25Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - CertDW: Towards Certified Dataset Ownership Verification via Conformal Prediction [48.82467166657901]
本稿では,最初の認証データセット透かし(CertDW)とCertDWベースの認証データセットオーナシップ検証手法を提案する。
共形予測に触発されて,主確率 (PP) と透かし頑健性 (WR) の2つの統計指標を導入する。
我々は、不審モデルのWR値が、透かしのないデータセットでトレーニングされた良性モデルのPP値を大幅に上回る場合に、PPとWRの間に証明可能な低い境界が存在することを証明した。
論文 参考訳(メタデータ) (2025-06-16T07:17:23Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。