論文の概要: Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates
- arxiv url: http://arxiv.org/abs/2603.08578v1
- Date: Mon, 09 Mar 2026 16:34:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.48994
- Title: Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates
- Title(参考訳): Drift-to-Action Controllers: オンラインリスク証明書による予算介入
- Authors: Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh,
- Abstract要約: Drift2Actは、監視を明示的な安全性で制約された意思決定として扱う、ドリフト・ツー・アクションのコントローラである。
ほぼゼロに近い安全違反と、WILDS Camelyon17、DomainNet、および制御された合成ドリフトストリームの適度なコストでの高速回復を実現する。
- 参考スコア(独自算出の注目度): 1.565870461096057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deployed machine learning systems face distribution drift, yet most monitoring pipelines stop at alarms and leave the response underspecified under labeling, compute, and latency constraints. We introduce Drift2Act, a drift-to-action controller that treats monitoring as constrained decision-making with explicit safety. Drift2Act combines a sensing layer that maps unlabeled monitoring signals to a belief over drift types with an active risk certificate that queries a small set of delayed labels from a recent window to produce an anytime-valid upper bound $U_t(δ)$ on current risk. The certificate gates operation: if $U_t(δ) \le τ$, the controller selects low-cost actions (e.g., recalibration or test-time adaptation); if $U_t(δ) > τ$, it activates abstain/handoff and escalates to rollback or retraining under cooldowns. In a realistic streaming protocol with label delay and explicit intervention costs, Drift2Act achieves near-zero safety violations and fast recovery at moderate cost on WILDS Camelyon17, DomainNet, and a controlled synthetic drift stream, outperforming alarm-only monitoring, adapt-always adaptation, schedule-based retraining, selective prediction alone, and an ablation without certification. Overall, online risk certification enables reliable drift response and reframes monitoring as decision-making with safety.
- Abstract(参考訳): デプロイされた機械学習システムは分散のドリフトに直面しているが、ほとんどの監視パイプラインはアラームで停止し、ラベル付け、計算、レイテンシの制約の下で応答を過小評価する。
Drift2Actは、監視を明示的な安全性で制約された意思決定として扱う、ドリフト・ツー・アクション・コントローラである。
Drift2Actは、ラベルのない監視信号をドリフトタイプに関する信念にマッピングするセンサー層と、最近のウィンドウから遅延ラベルの小さなセットをクエリして、現在のリスクに基づいて、任意の値の上限である$U_t(δ)$を生成するアクティブリスク証明書を組み合わせる。
認証ゲートの操作:$U_t(δ) \le τ$ の場合、コントローラは低コストのアクション(例えば、再校正やテスト時間適応)を選択し、$U_t(δ) > τ$ の場合、abstain/handoff を起動し、冷蔵下でロールバックまたは再トレーニングするためにエスカレートする。
ラベル遅延と明示的な介入コストを備えた現実的なストリーミングプロトコルでは、Drift2Actは、WILDS Camelyon17、DomainNet、および制御された合成ドリフトストリームにおいて、ほぼゼロに近い安全違反と迅速な回復を達成する。
全体として、オンラインリスク認定は、安全な意思決定として信頼性の高いドリフト応答とリフレーム監視を可能にする。
関連論文リスト
- Detecting Object Tracking Failure via Sequential Hypothesis Testing [80.7891291021747]
ビデオにおけるリアルタイムのオンラインオブジェクト追跡は、コンピュータビジョンにおける中核的なタスクである。
本稿では,物体追跡を逐次的仮説テストとして解釈することを提案する。
本研究では,地中追跡情報と内部追跡情報の両方を活用することにより,教師なしと教師なしの両方の変種を提案する。
論文 参考訳(メタデータ) (2026-02-13T14:57:15Z) - DriftGuard: A Hierarchical Framework for Concept Drift Detection and Remediation in Supply Chain Forecasting [0.0]
現在の業界慣行は、3~6ヶ月ごとに手動の監視と定期的な再訓練に依存している。
DriftGuardは、早期にドリフトを検出し、その根本原因を説明し、影響を受けるモデルを自動的に修正するエンド・ツー・エンドのシステムである。
論文 参考訳(メタデータ) (2026-01-13T19:08:11Z) - Proactive DDoS Detection and Mitigation in Decentralized Software-Defined Networking via Port-Level Monitoring and Zero-Training Large Language Models [3.6260109722491465]
Software-Defined Networking (cSDN)は、柔軟でプログラム可能なネットワーク制御を提供するが、スケーラビリティと信頼性の問題に悩まされている。
分散化されたSDN(dSDN) 複数のローカルコントローラ間で制御を分散することで、これらの懸念を緩和する。
このアーキテクチャは、Denial-of-Service(DDoS)攻撃に対して非常に脆弱である。
本稿では,dSDN環境に適した新しい検出・緩和フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-01T08:57:29Z) - Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols [80.68060125494645]
プロトコルとモニタモデルを知っている信頼できないモデルによるアダプティブアタックについて検討する。
我々は、攻撃者がモデル出力に公知またはゼロショットプロンプトインジェクションを埋め込む単純な適応攻撃ベクトルをインスタンス化する。
論文 参考訳(メタデータ) (2025-10-10T15:12:44Z) - Delay Independent Safe Control with Neural Networks: Positive Lur'e Certificates for Risk Aware Autonomy [0.5729426778193398]
本稿では,自律型学習可能制御システムに対するリスク認識型安全性保証手法を提案する。
我々は、局所セクター境界を持つニューラルネットワーク(NN)コントローラをモデル化し、線形で遅延非依存の証明書を導出する正の構造の活用を行う。
論文 参考訳(メタデータ) (2025-10-08T05:22:28Z) - Beyond Linear Probes: Dynamic Safety Monitoring for Language Models [67.15793594651609]
従来の安全モニタは、クエリ毎に同じ量の計算を必要とする。
動的アクティベーションモニタリングのための線形プローブの自然な拡張であるTrncated Polynomials (TPCs)を紹介する。
我々の重要な洞察は、TPCを段階的に、短期的に訓練し、評価できるということです。
論文 参考訳(メタデータ) (2025-09-30T13:32:59Z) - How Much Is Too Much? Adaptive, Context-Aware Risk Detection in Naturalistic Driving [0.6299766708197883]
ラベルやモデルを時間とともに、ドライバ間で適応する統合されたコンテキスト対応フレームワークを提案する。
このフレームワークは、速度重み付けされたヘッドウェイと厳しい運転イベントの2つの安全指標と、ランダムフォレスト、XGBoost、ディープニューラルネットワーク(DNN)の3つのモデルを用いてテストされている。
全体として、このフレームワークは、リアルタイムの安全フィードバックを強化し、インテリジェントな交通システムにおけるドライバー中心の介入をサポートする、適応的でコンテキスト対応のリスク検出を約束している。
論文 参考訳(メタデータ) (2025-07-26T16:24:25Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - CANTXSec: A Deterministic Intrusion Detection and Prevention System for CAN Bus Monitoring ECU Activations [53.036288487863786]
物理ECUアクティベーションに基づく最初の決定論的侵入検知・防止システムであるCANTXSecを提案する。
CANバスの古典的な攻撃を検知・防止し、文献では調査されていない高度な攻撃を検知する。
物理テストベッド上での解法の有効性を実証し,攻撃の両クラスにおいて100%検出精度を達成し,100%のFIAを防止した。
論文 参考訳(メタデータ) (2025-05-14T13:37:07Z) - WATCH: Adaptive Monitoring for AI Deployments via Weighted-Conformal Martingales [22.789611187514975]
非パラメトリックシーケンシャルテストのメソッド -- 特にコンフォーマルテストマーチンチャル(CTM)と任意の時間価推論 -- は、この監視タスクに有望なツールを提供する。
既存のアプローチは、限られた仮説クラスやアラーム基準の監視に限られています。」
論文 参考訳(メタデータ) (2025-05-07T17:53:47Z) - Bandit Quickest Changepoint Detection [55.855465482260165]
すべてのセンサの継続的な監視は、リソースの制約のためにコストがかかる可能性がある。
有限パラメータ化確率分布の一般クラスに対する検出遅延に基づく情報理論の下界を導出する。
本稿では,異なる検知オプションの探索と質問行動の活用をシームレスに両立させる,計算効率のよいオンラインセンシング手法を提案する。
論文 参考訳(メタデータ) (2021-07-22T07:25:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。