論文の概要: TCD-Arena: Assessing Robustness of Time Series Causal Discovery Methods Against Assumption Violations
- arxiv url: http://arxiv.org/abs/2605.03045v1
- Date: Mon, 04 May 2026 18:12:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.590124
- Title: TCD-Arena: Assessing Robustness of Time Series Causal Discovery Methods Against Assumption Violations
- Title(参考訳): TCD-Arena: 推定違反に対する時系列因果発見法のロバスト性評価
- Authors: Gideon Stein, Niklas Penzel, Tristan Piater, Joachim Denzler,
- Abstract要約: 因果発見 (Causal Discovery, CD) は科学的調査のための強力な枠組みである。
しかし、その実践的採用は、強い、しばしば検証不可能な仮定への依存によって妨げられている。
時系列CDアルゴリズムの堅牢性を評価するために,モジュール化,高度にカスタマイズ可能,拡張可能なテストキットであるTCD-Arenaを提案する。
- 参考スコア(独自算出の注目度): 8.411355178908655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal Discovery (CD) is a powerful framework for scientific inquiry. Yet, its practical adoption is hindered by a reliance on strong, often unverifiable assumptions and a lack of robust performance assessment. To address these limitations and advance empirical CD evaluation, we present TCD-Arena, a modularized, highly customizable, and extendable testing kit to assess the robustness of time series CD algorithms against stepwise more severe assumption violations. For demonstration, we conduct an extensive empirical study comprising around 30 million individual CD attempts and reveal nuanced robustness profiles for 33 distinct assumption violations. Further, we investigate CD ensembles and find that they have the potential to improve general robustness, which has implications for real-world applications. With this, we strive to ultimately facilitate the development of CD methods that are reliable for a diverse range of synthetic and potentially real-world data conditions.
- Abstract(参考訳): 因果発見 (Causal Discovery, CD) は科学的調査のための強力な枠組みである。
しかし、その実践的採用は、強い、しばしば検証不可能な仮定への依存と、堅牢なパフォーマンス評価の欠如によって妨げられている。
これらの制限に対処し、経験的CD評価を推し進めるために、より厳密な仮定違反に対する時系列CDアルゴリズムの堅牢性を評価するために、モジュール化され、高度にカスタマイズ可能で拡張可能なテストキットであるTCD-Arenaを提案する。
実証のために,約3000万件のCD試行からなる広範な実証研究を行い,33の異なる仮定違反に対するニュアンスな堅牢性プロファイルを明らかにした。
さらに,CDアンサンブルについて検討し,実世界の応用に影響を及ぼす汎用ロバスト性の向上の可能性を見出した。
これにより,多種多様な合成および潜在的実世界のデータ条件に対して信頼性の高いCD手法の開発を究極的に促進する。
関連論文リスト
- Towards Trustworthy Depression Estimation via Disentangled Evidential Learning [50.22167852149165]
EviDepはうつ病の重症度を共同で定量化する明らかな学習フレームワークである。
EviDepは、堅牢な証拠合成を保証するために厳密な情報整合性を強制する。
最先端の予測精度と優れた不確実性校正を実現し、信頼できる臨床スクリーニングのための堅牢なフェールセーフメカニズムを提供する。
論文 参考訳(メタデータ) (2026-04-17T13:27:11Z) - DR$^{3}$-Eval: Towards Realistic and Reproducible Deep Research Evaluation [55.02569059688697]
Deep Research Agents (DRA) は、計画、検索、マルチモーダル理解、レポート生成を含む、複雑で長期にわたる研究課題を解決することを目的としている。
DR$3$-Evalは,マルチモーダル・マルチファイルレポート生成におけるディープリサーチエージェントの評価のための,現実的で再現可能なベンチマークである。
論文 参考訳(メタデータ) (2026-04-16T06:40:02Z) - CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios [17.11442807888366]
Causalは、時系列因果発見法の堅牢性を評価するために設計されたベンチマークスイートである。
我々は8つの仮定違反シナリオにまたがる代表的なTSCDアルゴリズムの広範なベンチマークを行う。
様々なシナリオで優れた全体的なパフォーマンスを示す方法は、ほとんどディープラーニングベースのアプローチである。
論文 参考訳(メタデータ) (2026-02-08T11:27:06Z) - Token Constraint Decoding Improves Robustness on Question Answering for Large Language Models [4.078176555898098]
我々は,Token Constraint Decoding (TCD)を導入し,評価する。
この単純で効果的な推論時間アルゴリズムは、ノイズのある設定で堅牢性を高めるためにトークンレベルの予測をアライメントする。
本研究は, 実世界の不完全条件下での推論安定性向上のための, 実用的, モデルに依存しないアプローチとして, TCDを確立した。
論文 参考訳(メタデータ) (2025-06-11T05:33:56Z) - Prompt Transfer for Dual-Aspect Cross Domain Cognitive Diagnosis [17.834034928196687]
認知診断(CD)は、学生のインタラクションデータに基づいて認知状態を評価することを目的としており、エクササイズレコメンデーションやパーソナライズされた学習指導といった下流の応用を可能にする。
本稿では,認知診断にソフト・プロンプト・トランスファーを利用するシンプルで効果的なフレームワークであるPromptCDを提案する。
PromptCDは多様なCDCDシナリオにシームレスに適応するように設計されており、学生向けCDCDにPromptCD-S、運動用CDCDにPromptCD-Eを導入している。
論文 参考訳(メタデータ) (2024-12-06T12:59:03Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Triadic-OCD: Asynchronous Online Change Detection with Provable Robustness, Optimality, and Convergence [2.1348070823841363]
本稿では,証明可能な堅牢性,証明可能な最適性,保証された収束性を備えた3進OCDフレームワークを開発する。
提案アルゴリズムは、完全に非同期な分散方式で実現でき、単一のサーバにデータを送信する必要がなくなる。
Triadic-OCDの非漸近収束特性は理論的に解析され、$epsilon$-Optimal点を達成するための複雑さが導出される。
論文 参考訳(メタデータ) (2024-05-03T10:10:11Z) - Density-aware Chamfer Distance as a Comprehensive Metric for Point Cloud
Completion [90.26652899910019]
チャンファー距離 (CD) とアースモーバー距離 (EMD) は、2つの点集合間の類似度を測定するために広く採用されている2つの指標である。
本稿では,DCD(Dedentity-Aware Chamfer Distance)と呼ばれる新しい類似度尺度を提案する。
DCDは、全体構造と局所的詳細の両方に注意を払っており、CDと矛盾する場合でも、より信頼性の高い評価を提供する。
論文 参考訳(メタデータ) (2021-11-24T18:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。