論文の概要: Explainable Wastewater Digital Twins: Adaptive Context-Conditioned Structured Simulators with Self-Falsifying Decision Support
- arxiv url: http://arxiv.org/abs/2605.19826v1
- Date: Tue, 19 May 2026 13:19:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.366399
- Title: Explainable Wastewater Digital Twins: Adaptive Context-Conditioned Structured Simulators with Self-Falsifying Decision Support
- Title(参考訳): 説明可能な排水デジタル双生児:自己Falsifying決定支援型適応型コンテキスト制御型構造化シミュレータ
- Authors: Gary Simethy, Daniel Ortiz Arroyo, Petar Durdevic,
- Abstract要約: CCSS-IXは、コンテキスト認識ゲーティングネットワークによって適応的に混合された、解釈可能な局所線形状態空間"専門家"のバンクである。
実行時決定層は、統計的に認証できないオペレータが提案するアクションに対して、不当な時間的証人を排除、再開、または返却するために共形リスク制御を適用する。
- 参考スコア(独自算出の注目度): 2.3895981099137535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operators of safety-critical industrial processes increasingly rely on digital twins to screen control interventions, but such simulators rarely carry certified safety guarantees. Wastewater treatment plants exemplify the gap: operators face a daily safety-efficiency trade-off where aerating too little risks effluent violations and nitrous-oxide (N2O) spikes, and aerating too much wastes energy. We develop an explainable digital twin for aeration and dosing setpoints. CCSS-IX, the simulator, is a bank of interpretable locally linear state-space "experts" adaptively mixed by a context-aware gating network, building on a continuous-time regime-switching scaffold. A runtime decision layer applies conformal risk control to abstain, reopen, or return a falsifying temporal witness for any operator-proposed action that cannot be statistically certified. The artificial-intelligence contribution is twofold: an identifiable, context-conditioned structured surrogate that retains operator-readable dynamics, and a self-falsifying decision rule with finite-sample coverage guarantees. The engineering contribution is a validated, end-to-end decision-support pipeline, tested on a 1000-step slice of the Avedøre full-scale plant (42.6% sensor missingness, 2-minute sampling), the Agtrup/BlueKolding full-scale plant in Denmark, and the Benchmark Simulation Model No. 2 (BSM2) international benchmark, under a matched ten-seed protocol. The static structured ensemble lies within 0.78% root-mean-square error of an unconstrained black-box reference, and the adaptive variant within 1.08%. The calibrated reopen rule cuts aggregate two-plant regret by 43.6% at an unsafe-action cost weight of 4 and eliminates unsafe chosen actions on the BSM2 main slice. Event-aligned temporal witnesses prevent 93 of 187 false-safe N2O approvals, about 4.65x the dyadic baseline (paired McNemar p < 1e-21).
- Abstract(参考訳): 安全クリティカルな産業プロセスのオペレーターは、制御介入のスクリーニングにデジタルツインをますます頼っているが、そのようなシミュレータが認証された安全保証を担っていることは滅多にない。
オペレーターは日々の安全と効率のトレードオフに直面しており、そこでは過負荷のリスクは少なく、窒素酸化物(N2O)はスパイクし、過負荷のエネルギーを消費する。
エアレーションとドージングセットポイントのための説明可能なディジタルツインを開発した。
シミュレータであるCCSS-IXは、コンテキスト認識ゲーティングネットワークによって適応的に混合された、解釈可能な局所線形状態空間"専門家"のバンクであり、連続的な状態スイッチングの足場の上に構築されている。
実行時決定層は、統計的に認証できないオペレータが提案するアクションに対して、不当な時間的証人を排除、再開、または返却するために共形リスク制御を適用する。
人工的インテリジェンス貢献は、演算子可読性を保持する識別可能で文脈条件付き構造化されたサロゲートと、有限サンプルカバレッジを保証する自己偽判定ルールの2つである。
エンジニアリング・コントリビューションは、Avedøreフルスケールの1000ステップスライス(42.6%のセンサー不足、2分間のサンプリング)、デンマークのAgtrup/BlueKoldingフルスケールのプラント、ベンチマーク・シミュレーション・モデルNo.2(BSM2)国際ベンチマークでテストされた検証済みのエンドツーエンドの意思決定支援パイプラインである。
静的な構造を持つアンサンブルは、制約のないブラックボックス参照の0.78%のルート平均二乗誤差と1.08%の適応変種に収まる。
校正された再オープン規則は、BSM2メインスライスにおける安全でない選択された動作を排除し、安全でないコストの4で2つのプラントの後悔を43.6%削減する。
イベントアライメントの時間的目撃者は187件の偽安なN2O承認のうち93件を阻止し、この基準線は4.65倍である(McNemar p < 1e-21)。
関連論文リスト
- Action-Conditioned Risk Gating for Safety-Critical Control under Partial Observability [79.08785366532287]
部分観測可能性下でのリスク感応制御のための軽量なリスクゲート強化学習近似を提案する。
安全クリティカルな部分観測可能な2つの領域 – 自動グルコース調節と安全制約ナビゲーション – でアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-14T01:23:09Z) - Reliable Self-Harm Risk Screening via Adaptive Multi-Agent LLM Systems [6.14481021961242]
有向非巡回グラフ(DAG)として構造化されたマルチエージェントパイプラインの統計的枠組みを提案する。
我々は各エージェントをカテゴリー決定としてモデル化し、より厳密なエージェントレベルのパフォーマンス信頼境界を導入する。
本研究では,2つのラベル付きデータセットを用いた行動保健システムの評価を行った。
論文 参考訳(メタデータ) (2026-04-24T01:52:54Z) - Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - Partial Number Theoretic Transform Masking in Post Quantum Cryptography Hardware: A Security Margin Analysis [0.0]
ML-DSAとML-KEMのハードウェアアクセラレータAdams Bridgeは、Inverse Number Theoretic Transformレイヤの1をマスクし、残りの部分はシャッフルに頼っている。
著者らは,信頼度の高い7つの分析トラックをまたいだサイドチャネル文学に対するこれらの主張を,信頼性の高い証拠を用いて評価した。
論文 参考訳(メタデータ) (2026-04-04T17:38:34Z) - Severe Domain Shift in Skeleton-Based Action Recognition:A Study of Uncertainty Failure in Real-World Gym Environments [0.0]
本稿では,新しいGym2DデータセットとUCF101データセットを用いて,厳しい領域シフトの体系的研究を行う。
我々の研究は、標準的なデプロイメント仮定に挑戦し、セマンティックスケルトン認識と幾何学的スケルトン認識の両方のデプロイの安全性を原則として分析する。
論文 参考訳(メタデータ) (2026-03-16T17:37:17Z) - TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same [2.755751829139168]
ほとんどの不確実性を認識したロボットシステムは、予測の不確実性を単一のスカラースコアに分解し、それを使って一様に修正された応答をトリガーする。
このアグリゲーションは、破損した観測結果から不確実性が生じるか、あるいは学習されたモデルと真のシステム力学とのミスマッチから生じるのかを曖昧にしている。
本研究では,不確かさを動脈およびてんかん成分に分解する軽量なポストホックフレームワークを導入し,これらの信号を用いて推論時のシステム応答を調節する。
論文 参考訳(メタデータ) (2026-03-09T09:07:43Z) - Beyond Reward Suppression: Reshaping Steganographic Communication Protocols in MARL via Dynamic Representational Circuit Breaking [0.0]
監視を回避するためのプライベートプロトコルを開発するエージェントによるステガノグラフィーの共謀は、AIの安全性に重大な脅威をもたらす。
既存の防御は行動層や報酬層に限られており、潜伏する通信路での調整を検知できない。
本稿では,動的表現回路ブレーカ(DRCB)について紹介する。
論文 参考訳(メタデータ) (2026-03-07T04:14:38Z) - Unsupervised Anomaly Detection in Multi-Agent Trajectory Prediction via Transformer-Based Models [45.08545174556591]
マルチエージェントトランスを用いた教師なし異常検出フレームワークを提案する。
検出安定性と物理的アライメントの両方を評価するための二重評価手法が提案されている。
本フレームワークでは,時間対衝突および統計ベースラインに欠落した388個の特異な異常を同定する。
論文 参考訳(メタデータ) (2026-01-28T08:33:10Z) - Reinforcement Learning from Probabilistic Forecasts for Safe Decision-Making via Conditional Value-at-Risk Planning [41.52380204321823]
本稿では,ベイズ予測,後方サンプリング強化学習,計画とを結合した統一的枠組みである不確実性認識マルコフ決定プロセス(UAMDP)を提案する。
構造的不確実性と経済のボラティリティを特徴とする2つのドメインの高頻度株式取引と小売在庫管理において,UAMDPを評価した。
論文 参考訳(メタデータ) (2025-10-09T13:46:32Z) - Multimodal Safety Evaluation in Generative Agent Social Simulations [43.972551727499116]
エージェントを3次元で評価するための再現可能なシミュレーションフレームワークを提案する。
エージェントはしばしば、地域のリビジョンとグローバルな安全の整合に失敗し、安全でない計画の修正で55%の成功率にしか達していないことを示す。
特に、誤解を招く視覚と組み合わせると、安全でない行動の45%が受け入れられ、画像が過信される傾向が強かった。
論文 参考訳(メタデータ) (2025-10-09T02:42:57Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。