Fugu-MT 論文翻訳(概要): Policy-driven Conformal Prediction for Trustworthy QoT Estimation

論文の概要: Policy-driven Conformal Prediction for Trustworthy QoT Estimation

arxiv url: http://arxiv.org/abs/2606.12501v1
Date: Wed, 10 Jun 2026 16:04:21 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.373098
Title: Policy-driven Conformal Prediction for Trustworthy QoT Estimation
Title（参考訳）: 信頼に値するQoT推定のためのポリシ駆動型コンフォーマル予測
Authors: Kiarash Rezaei, Omran Ayoub, Paolo Monti, Carlos Natalino,
Abstract要約: 統計的に保証されたQoT推定と運用上の決定ポリシを組み合わせた,ポリシ駆動型フレームワークであるConformal QoTを提案する。我々は、Conformal QoTが、ドメインシフトの下で信頼できる光パス実現可能性予測を提供し、オープンデータセットで92%から99.6%の精度を向上できることを示した。
参考スコア（独自算出の注目度）: 1.0709603403936399
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose Conformal QoT, a policy-driven framework that combines statistically guaranteed QoT estimation with operational decision policies, enabling reliable lightpath-feasibility predictions under domain shift and improving accuracy from 92\% to 99.6\% on open datasets.
Abstract（参考訳）: 提案するConformal QoTは,統計的に保証されたQoT推定と運用上の決定ポリシを組み合わせることで,ドメインシフト時の信頼性の高い光パス実現可能性予測を実現し,オープンデータセット上での精度を92\%から99.6\%に向上する。

関連論文リスト

Multi-CALF: A Policy Combination Approach with Statistical Guarantees [0.0]
相対値改善に基づく強化学習ポリシーをインテリジェントに組み合わせたアルゴリズムであるMulti-CALFを導入する。提案手法は、標準のRLポリシーと理論的に支持された代替ポリシーを統合し、正式な安定性保証を継承する。
論文参考訳（メタデータ） (2025-05-18T10:30:24Z)
Rectifying Conformity Scores for Better Conditional Coverage [75.73184036344908]
本稿では,分割共形予測フレームワーク内で信頼セットを生成する新しい手法を提案する。本手法は,任意の適合度スコアのトレーニング可能な変換を行い,条件付き範囲を正確に確保しつつ,条件付き範囲を改善する。
論文参考訳（メタデータ） (2025-02-22T19:54:14Z)
Beyond Confidence: Adaptive Abstention in Dual-Threshold Conformal Prediction for Autonomous System Perception [0.4124847249415279]
安全クリティカルな認識システムは、安全を維持するために確実な不確実性定量化と原則化された禁制機構を必要とする。本稿では,統計的に保証された不確実性推定を提供するとともに,リスクの高いシナリオにおいて選択的な予測を可能にする,新しいデュアルスレッド整合化フレームワークを提案する。
論文参考訳（メタデータ） (2025-02-11T04:45:31Z)
Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文参考訳（メタデータ） (2024-07-01T20:44:48Z)
Offline Policy Selection under Uncertainty [113.57441913299868]
我々は、オフラインポリシーの選択を、一定の経験データセットを与えられた政策予測のセットよりも学習の選好とみなす。政策価値に対する信念に対する完全な分布へのアクセスは、より幅広い下流評価指標の下でより柔軟な選択アルゴリズムを可能にする。 BayesDICEが任意の下流ポリシー選択メトリックに関してポリシーのランク付けにどのように使用されるかを示します。
論文参考訳（メタデータ） (2020-12-12T23:09:21Z)
Reliable Off-policy Evaluation for Reinforcement Learning [53.486680020852724]
シーケンシャルな意思決定問題において、非政治評価は、目標政策の期待累積報酬を推定する。本稿では、1つまたは複数のログデータを用いて、ロバストで楽観的な累積報酬推定を提供する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2020-11-08T23:16:19Z)
Statistical Bootstrapping for Uncertainty Estimation in Off-Policy Evaluation [38.31971190670345]
本研究は,政策の真の価値を校正した信頼区間を生成する手段として,統計的ブートストラップの可能性について検討する。本研究では, 連続制御環境や小規模なデータ体制など, 様々な条件下で精度の高い信頼区間が得られることを示す。
論文参考訳（メタデータ） (2020-07-27T14:49:22Z)
Stable Policy Optimization via Off-Policy Divergence Regularization [50.98542111236381]
信頼地域政策最適化(TRPO)とPPO(Pximal Policy Optimization)は、深層強化学習(RL)において最も成功した政策勾配アプローチの一つである。本稿では, 連続的な政策によって引き起こされる割引状態-行動訪問分布を, 近接項で抑制し, 政策改善を安定化させる新しいアルゴリズムを提案する。提案手法は, ベンチマーク高次元制御タスクの安定性と最終的な性能向上に有効である。
論文参考訳（メタデータ） (2020-03-09T13:05:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。