論文の概要: Signed Evidence Flow: Conflict-Aware and Stability-Calibrated Data Analysis
- arxiv url: http://arxiv.org/abs/2606.21875v1
- Date: Sat, 20 Jun 2026 04:29:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:28:37.913844
- Title: Signed Evidence Flow: Conflict-Aware and Stability-Calibrated Data Analysis
- Title(参考訳): 署名されたエビデンスフロー:矛盾認識と安定性校正データ分析
- Authors: Jeffery Opoku, David Banahene,
- Abstract要約: 本稿では, 適応予測ルールと符号付特徴属性を組み合わせて, 支持, 反対, 対立, 安定を計測する, 署名付きエビデンスフロー(SEF)を提案する。
我々は、信頼度が矛盾を正確に決定するのが、総証拠量も決定し、残条件分散を導出し、矛盾が信頼を超えた損失予測を改善できる状態であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern data analysis usually gives a prediction without showing whether the evidence behind it is clear, conflicting, or stable. Two cases can have the same fitted confidence even when one has mostly agreeing evidence and the other has strong support and strong opposition. We propose Signed Evidence Flow (SEF), which combines a fitted prediction rule with signed feature attributions to measure support, opposition, conflict, and perturbation stability. We prove that confidence determines conflict exactly when it also determines total evidence mass, derive the remaining conditional variance, and state when conflict can improve loss prediction beyond confidence and other audit variables. We also connect conflict to geometric decision fragility. Across healthcare, Covertype, black-box, finance, and ten external data sets, conflict sometimes separates risk among predictions that already appear confident. Cross-fitted tests show added error-ranking information beyond confidence and attribution entropy on several data sets, including two large finance tasks. The direction is not universal: in some tasks, lowconflict cases are riskier. We therefore introduce ScopeGate, a held-out permutation diagnostic that checks the direction before SEF is used for review triage. SEF is consequently an audit tool rather than a universal risk score: it describes evidence structure, while an independent calibration sample determines whether that structure is useful in the target population.
- Abstract(参考訳): 現代のデータ分析は通常、背後にある証拠が明確であるか、矛盾しているか、安定であるかを示すことなく予測を行う。
証拠にほぼ同意している場合と、強い支持と強い反対がある場合の2つのケースは、同等の信頼感を持つ。
本稿では, 適応予測規則と符号付特徴属性を組み合わせて, 支持, 反対, 対立, 摂動安定性を計測する符号付エビデンスフロー(SEF)を提案する。
我々は、信頼度が総エビデンス質量を正確に決定し、残条件分散を導出し、競合が信頼やその他の監査変数を超えて損失予測を改善できる状態であることを示す。
また、衝突は幾何学的な決定の脆弱さと結びついています。
医療、Covertype、ブラックボックス、ファイナンス、および10の外部データセットの競合は、すでに自信があるように見える予測の間でリスクを分離することがある。
クロスフィットテストでは、2つの大きな財務タスクを含む複数のデータセットに対して、信頼性と属性のエントロピーを超えたエラーレベルの情報が追加された。
方向性は普遍的ではなく、いくつかのタスクでは、低複雑性のケースの方がリスクが高い。
そこで本研究では,SEFがレビュートリアージに使用される前の方向をチェックする,ホールドアウト型置換診断であるScopeGateを紹介した。
SEFは普遍的なリスクスコアではなく監査ツールであり、エビデンス構造を記述し、独立したキャリブレーションサンプルは、その構造が対象の個体群に有用であるかどうかを判断する。
関連論文リスト
- Confident but Conflicted: Internal Uncertainty and Cognitive Dissonance Resolution in LLMs [6.968805961712596]
大規模言語モデル(LLM)は、以前の出力と矛盾する入力に頻繁に遭遇する。
不協和性は説得、バックファイア、免疫によって解決できる。
信頼の弾力性(Trust Elasticity, TE)は、モデルが矛盾する証拠に対していかに容易に説得されるかを示す、計量学的に着想を得た尺度である。
論文 参考訳(メタデータ) (2026-06-21T18:39:24Z) - When Evidence Conflicts: Uncertainty and Order Effects in Retrieval-Augmented Biomedical Question Answering [2.6393907656700706]
HealthContradictを用いて、5つの制御された証拠条件下で6つのオープンウェイト大言語モデル(LLM)を評価する。
その結果, バイオメディカルな証拠の相反は不確実性と堅牢性の両方の問題であることが示唆された。
論文 参考訳(メタデータ) (2026-05-13T21:02:24Z) - Towards Trustworthy Depression Estimation via Disentangled Evidential Learning [50.22167852149165]
EviDepはうつ病の重症度を共同で定量化する明らかな学習フレームワークである。
EviDepは、堅牢な証拠合成を保証するために厳密な情報整合性を強制する。
最先端の予測精度と優れた不確実性校正を実現し、信頼できる臨床スクリーニングのための堅牢なフェールセーフメカニズムを提供する。
論文 参考訳(メタデータ) (2026-04-17T13:27:11Z) - ERA: Evidence-based Reliability Alignment for Honest Retrieval-Augmented Generation [19.616905640490252]
本稿ではERA(Evidence-based Reliability Alignment)と呼ばれる新しいフレームワークを提案する。
提案手法は, 解答カバレッジと棄却のトレードオフを最適化し, 校正精度を向上し, ベースラインを著しく向上させる。
論文 参考訳(メタデータ) (2026-02-24T01:45:51Z) - Proximity-Based Evidence Retrieval for Uncertainty-Aware Neural Networks [6.9681910774977815]
本研究は,不確実性を考慮した意思決定のためのエビデンス・検索機構を提案する。
それぞれのテストインスタンスに対して、例題は埋め込み空間で検索され、それらの予測分布はデンプスター・シェーファー理論を介して融合される。
支持する証拠は明確であるため、決定は透明で監査可能である。
論文 参考訳(メタデータ) (2025-09-11T13:12:22Z) - Probabilistic Modeling of Disparity Uncertainty for Robust and Efficient Stereo Matching [61.73532883992135]
本稿では,新しい不確実性を考慮したステレオマッチングフレームワークを提案する。
我々はベイズリスクを不確実性の測定として採用し、データを別々に見積もり、不確実性をモデル化する。
論文 参考訳(メタデータ) (2024-12-24T23:28:20Z) - Revisiting Confidence Estimation: Towards Reliable Failure Prediction [53.79160907725975]
多くの信頼度推定法は誤分類誤りを検出するのに有害である。
本稿では, 最先端の故障予測性能を示す平坦な最小値を求めることにより, 信頼性ギャップを拡大することを提案する。
論文 参考訳(メタデータ) (2024-03-05T11:44:14Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Demystifying Causal Features on Adversarial Examples and Causal
Inoculation for Robust Network by Adversarial Instrumental Variable
Regression [32.727673706238086]
本稿では、因果的な観点から、敵の訓練を受けたネットワークにおける予期せぬ脆弱性を掘り下げる手法を提案する。
展開することで,不偏環境下での敵予測の因果関係を推定する。
その結果, 推定因果関係は, 正解率の正解率と高い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-03-02T08:18:22Z) - The Curse of Performance Instability in Analysis Datasets: Consequences,
Source, and Suggestions [93.62888099134028]
自然言語推論(NLI)および読み込み(RC)解析/ストレスセットにおける最先端モデルの性能は極めて不安定であることがわかった。
このことは、(1)不安定さがこれらの分析セットに基づいて引き出された結論の信頼性にどのように影響するかという3つの疑問を提起する。
不安定の原因に関する理論的説明と実証的証拠の両方を提示する。
論文 参考訳(メタデータ) (2020-04-28T15:41:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。