論文の概要: Causal-Audit: A Framework for Risk Assessment of Assumption Violations in Time-Series Causal Discovery
- arxiv url: http://arxiv.org/abs/2604.02488v1
- Date: Thu, 02 Apr 2026 19:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.191358
- Title: Causal-Audit: A Framework for Risk Assessment of Assumption Violations in Time-Series Causal Discovery
- Title(参考訳): Causal-Audit: 時系列因果発見における推定違反リスク評価フレームワーク
- Authors: Marco Ruiz, Miguel Arana-Catania, David R. Ardila, Rodrigo Ventura,
- Abstract要約: Causal-Auditは、仮定検証をキャリブレートされたリスクアセスメントとして形式化するフレームワークである。
このフレームワークは、5つの仮定ファミリにまたがるエフェクトサイズの診断を計算する。
証拠が信頼できる推論をサポートする場合にのみメソッドを推奨する、控え目な決定ポリシーを適用する。
- 参考スコア(独自算出の注目度): 1.7192141121569653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Time-series causal discovery methods rely on assumptions such as stationarity, regular sampling, and bounded temporal dependence. When these assumptions are violated, structure learning can produce confident but misleading causal graphs without warning. We introduce Causal-Audit, a framework that formalizes assumption validation as calibrated risk assessment. The framework computes effect-size diagnostics across five assumption families (stationarity, irregularity, persistence, nonlinearity, and confounding proxies), aggregates them into four calibrated risk scores with uncertainty intervals, and applies an abstention-aware decision policy that recommends methods (e.g., PCMCI+, VAR-based Granger causality) only when evidence supports reliable inference. The semi-automatic diagnostic stage can also be used independently for structured assumption auditing in individual studies. Evaluation on a synthetic atlas of 500 data-generating processes (DGPs) spanning 10 violation families demonstrates well-calibrated risk scores (AUROC > 0.95), a 62% false positive reduction among recommended datasets, and 78% abstention on severe-violation cases. On 21 external evaluations from TimeGraph (18 categories) and CausalTime (3 domains), recommend-or-abstain decisions are consistent with benchmark specifications in all cases. An open-source implementation of our framework is available.
- Abstract(参考訳): 時系列因果探索法は、定常性、正規サンプリング、有界時間依存性といった仮定に依存する。
これらの仮定が破られた場合、構造学習は自信を持つが、警告なしで因果グラフを誤解させる可能性がある。
仮定検証を校正リスク評価として形式化するフレームワークであるCausal-Auditを紹介する。
このフレームワークは、5つの仮定ファミリ(定常性、不規則性、永続性、非線形性、収束するプロキシ)にまたがる効果の大きさの診断を計算し、それらを不確実な間隔で4つのキャリブレーションされたリスクスコアに集約し、確証が信頼できる推論をサポートする場合にのみメソッド(例えば、PCMCI+、VARをベースとしたグランガー因果関係)を推奨する禁制的な決定ポリシーを適用する。
半自動診断段階は、個々の研究における構造化された仮定監査にも独立して用いられる。
10の違反家系にまたがる500種類のデータ生成過程(DGP)の合成アトラスの評価では、良好な校正リスクスコア(AUROC > 0.95)が示され、推奨データセットの62%が偽陽性で、重度違反の場合は78%が禁じられている。
TimeGraph(18のカテゴリ)とCausalTime(3のドメイン)からの21の外部評価では、推奨または確固たる決定は、すべてのケースにおいてベンチマーク仕様と一致しています。
私たちのフレームワークのオープンソース実装が利用可能です。
関連論文リスト
- Entropy Alone is Insufficient for Safe Selective Prediction in LLMs [20.664633053172327]
選択予測システムは、高リスクケースでの回答を控えることで、言語モデル幻覚による害を軽減することができる。
不確実性定量化技術はしばしばそのようなケースを特定するために用いられるが、より広い選択的予測ポリシーの文脈で評価されることはほとんどない。
エントロピーに基づく不確実性手法のモデル依存的故障モードを同定し、エントロピースコアと正当性プローブ信号を組み合わせることで、信頼できない禁忌行動に対処する。
論文 参考訳(メタデータ) (2026-03-22T11:27:13Z) - Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction [2.289837306672451]
規制ストレステストでは、仮説的なマクロ経済シナリオの下で信用損失を予測する必要がある。
パネルにおけるポリシーパスの反ファクト推論のためのフレームワークを提案する。
実失業データを用いたシミュレーションおよび半合成実験により,すべての結果を検証した。
論文 参考訳(メタデータ) (2026-03-08T03:22:38Z) - CVPL: A Geometric Framework for Post-Hoc Linkage Risk Assessment in Protected Tabular Data [0.0]
形式的なプライバシメトリクスはコンプライアンス指向の保証を提供するが、リリースされたデータセットにおける実際のリンク可能性の定量化に失敗することが多い。
CVPLは、ブロッキング、ベクトル化、潜在射影、類似性評価を含む演算子パイプラインとしてリンク解析を表現している。
19の構成にまたがる10,000レコードの実証的検証は、正式なk匿名性コンプライアンスが経験的結合性と共存することを示した。
論文 参考訳(メタデータ) (2026-02-11T16:39:07Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - Compartmentalised Agentic Reasoning for Clinical NLI [34.03033779546207]
我々は,知識アクセスを原則推論から分離する臨床NLIのための比較的エージェント推論であるCARENLIを紹介する。
CARENLIは最大42ポイントの忠実度を向上し、Causal Attributionの98.0%、リスク状態抽象化の81.2%に達した。
論文 参考訳(メタデータ) (2025-09-12T13:14:47Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Bayesian Model Averaging for Data Driven Decision Making when Causality
is Partially Known [0.0]
我々はベイズモデル平均化(BMA)のようなアンサンブル法を用いて因果グラフの集合を推定する。
潜在的な介入の期待値とリスクを明示的に計算して意思決定を行います。
論文 参考訳(メタデータ) (2021-05-12T01:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。