論文の概要: Causal Parametric Drift Simulation: A Digital Twin Framework for Classifier Robustness Evaluation
- arxiv url: http://arxiv.org/abs/2605.09663v1
- Date: Sun, 10 May 2026 17:28:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.357752
- Title: Causal Parametric Drift Simulation: A Digital Twin Framework for Classifier Robustness Evaluation
- Title(参考訳): 因果パラメトリックドリフトシミュレーション:ロバスト性評価のためのディジタルツインフレームワーク
- Authors: Julien Lafrance, Richard Khoury, Véronique Tremblay,
- Abstract要約: 動的環境における機械学習の分類器は、コンセプトドリフトに直面している。
構造因果モデルを用いて既存のドリフト検出を補完するフレームワークをDigital Twinsとして提案する。
我々の手法であるCausal Parametric Drift Simulation, stress-tests classifications to identify vulnerabilities before deployment。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine learning classifiers in dynamic environments face concept drift -- changes in the data-generating process that degrade performance. Conventional evaluation via static test sets or noise perturbations fails to preserve causal dependencies in tabular data, often producing causally invalid assessments. Post-hoc tools like SHAP and LIME offer correlational insights that may not reflect the causal mechanisms driving model failure. We propose a framework that complements existing drift detection by leveraging Structural Causal Models as "Digital Twins" of data-generating processes, enabling precise causal interventions while preserving structural dependencies. Our technique, Causal Parametric Drift Simulation, stress-tests classifiers to identify vulnerabilities before deployment. Experiments on the Open Sourcing Mental Illness (OSMH) dataset demonstrate that this approach exposes latent vulnerabilities invisible to standard statistical monitors.
- Abstract(参考訳): 動的環境における機械学習の分類器はコンセプトドリフトに直面する -- パフォーマンスを低下させるデータ生成プロセスの変化。
静的テストセットやノイズ摂動による従来の評価は、表データの因果依存性を保たず、しばしば因果的不正な評価を生み出す。
SHAPやLIMEのようなポストホックなツールは、モデル失敗を駆動する因果的メカニズムを反映しない相関的な洞察を提供する。
本稿では,データ生成プロセスの「デジタルツイン」として構造因果モデルを活用することにより,既存のドリフト検出を補完するフレームワークを提案する。
我々の手法であるCausal Parametric Drift Simulation, stress-tests classifications to identify vulnerabilities before deployment。
Open Sourcing Mental Illness (OSMH)データセットの実験では、このアプローチが標準統計モニターに見えない潜伏する脆弱性を公開することが示されている。
関連論文リスト
- Non-Parametric Rehearsal Learning via Conditional Mean Embeddings [88.89267783967263]
本研究では,不必要な未来(AUF)問題をテキスト化するための非パラメトリックリハーサル学習手法を提案する。
具体的には、カーネル機械を用いてAUFの目的を、動作誘起分布変化から所望性モデリングを遠ざける統一表現に再構成する。
論文 参考訳(メタデータ) (2026-05-09T15:30:52Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Lost in the Noise: How Reasoning Models Fail with Contextual Distractors [57.31788955167306]
推論モデルとエージェントAIシステムの最近の進歩は、多様な外部情報への依存度を高めている。
NoisyBenchは、RAGの11のデータセット、推論、アライメント、ツール使用タスクに対して、モデルロバスト性を体系的に評価する包括的なベンチマークである。
評価の結果,文脈的障害に直面した場合,最先端モデルでは最大80%の破滅的な性能低下がみられた。
論文 参考訳(メタデータ) (2026-01-12T05:43:51Z) - Learning Causality for Longitudinal Data [1.2691047660244335]
この論文は、高次元の時間変化データにおける因果推論と因果表現学習の手法を開発する。
最初のコントリビューションは、個別処理効果(ITE)を推定するモデルであるCDVAE(Causal Dynamic Variational Autoencoder)の導入である。
第2のコントリビューションでは,Contrastive Predictive Coding (CPC) とInfoMaxによって強化された RNN に基づく長期的反事実回帰のための効率的なフレームワークを提案する。
第3のコントリビューションは、潜伏が観察された変数にどのように現れるかに対処することでCRLを前進させる。
論文 参考訳(メタデータ) (2025-12-04T16:51:49Z) - Dynamic Evaluation for Oversensitivity in LLMs [68.27609301865174]
過敏性は、言語モデルが実際に良性であるプロンプトを防衛的に拒否するときに起こる。
この振る舞いはユーザインタラクションを妨害するだけでなく、有害なコンテンツと無害なコンテンツの境界を曖昧にする。
既存のベンチマークは、モデルの発展に伴ってオーバータイムを低下させる静的データセットに依存している。
論文 参考訳(メタデータ) (2025-10-21T18:33:47Z) - Towards a more realistic evaluation of machine learning models for bearing fault diagnosis [0.28873930745906956]
本稿では,振動を用いた軸受故障診断におけるデータ漏洩問題とそのモデル評価への影響について検討する。
本研究では, 軸受データ分割に着目したリークフリー評価手法を提案し, トレーニングやテストに使用する物理部品の重複を防止した。
CWRU、パダーボーン大学(PU)、オタワ大学(UORED-VAF)の3つの広く採用されているデータセットに対する方法論の評価を行った。
論文 参考訳(メタデータ) (2025-09-26T12:35:02Z) - Crafting Imperceptible On-Manifold Adversarial Attacks for Tabular Data [38.89245780759371]
本稿では,混合入力変分オートエンコーダ(VAE)を用いた遅延空間摂動フレームワークを提案し,統計的に一貫した逆の例を生成する。
提案手法は,従来の入力空間攻撃と比較して,アウトレーラ率と一貫した性能を著しく低下させることを示す。
論文 参考訳(メタデータ) (2025-07-15T05:34:44Z) - Does Unsupervised Domain Adaptation Improve the Robustness of Amortized Bayesian Inference? A Systematic Evaluation [3.4109073456116477]
近年のロバストなアプローチでは、シミュレーションおよび観測データの埋め込み空間と一致するように、教師なし領域適応(UDA)が採用されている。
本研究では,領域間の要約空間の整合が,非モデル化現象や雑音の影響を効果的に緩和することを示した。
以上の結果から,UDAを用いてABIのロバスト性を高める際に,不特定型を慎重に検討することの必要性が示唆された。
論文 参考訳(メタデータ) (2025-02-07T14:13:51Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。