論文の概要: Target-confidence Recourse Using tSeTlin machines: TRUST
- arxiv url: http://arxiv.org/abs/2606.18832v1
- Date: Wed, 17 Jun 2026 09:07:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.077662
- Title: Target-confidence Recourse Using tSeTlin machines: TRUST
- Title(参考訳): tSeTlin マシンを用いたTRUST
- Authors: K. Darshana Abeyrathna, Sara El Mekkaoui, Nils Enric Canut Taugbøl, Anuja Vats,
- Abstract要約: ターゲット信頼の反事実は、従来の境界に基づくアプローチよりも堅牢な会話を生み出す。
本稿ではtSeTlinマシン(tSeTlinマシン)を用いたTarget-confidence Recourseを提案する。
信頼を明示的に制御し、規則レベルの安定性を露呈することで、TRUSTは高い意思決定支援のための実行可能なレコースを提供する。
- 参考スコア(独自算出の注目度): 0.5599792629509229
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterfactual explanations are widely used to provide algorithmic recourse in high-stakes decision-making systems. Most existing methods seek the smallest change to an input that flips a model's decision. However, decision-makers often rely not only on predicted labels but also on confidence thresholds and risk margins. Counterfactuals that barely cross a decision boundary can be fragile and unstable under noise or model variation. In this paper, we propose Target-confidence Recourse Using tSeTlin machines (TRUST), a framework in which users explicitly specify the desired prediction confidence for recourse. Rather than generating counterfactuals and evaluating confidence afterward, TRUST directly searches for minimal changes that satisfy a user-defined confidence target, enabling comparison of recourse options in terms of cost, confidence, and robustness. We instantiate TRUST using a Probabilistic Tsetlin Machine (PTM) combined with Bayesian optimization. The probabilistic clause-based structure of PTM links prediction confidence to the stability of decision rules. We show that counterfactuals satisfying the same rules can still differ substantially in reliability depending on how securely they satisfy those rules, revealing whether decisions are supported by robust or fragile clause activations. Experiments on synthetic and real-world datasets demonstrate that target-confidence counterfactuals produce more robust and interpretable recourse than conventional boundary-based approaches. Across multiple benchmarks, TRUST achieves perfect robustness while maintaining low recourse cost, including an L2 distance of 0.10 on the Haberman dataset at 0.92 confidence. By explicitly controlling confidence and exposing rule-level stability, TRUST provides actionable recourse for high-stakes decision support.
- Abstract(参考訳): カウンターファクトな説明は、ハイテイクな意思決定システムにおいてアルゴリズムによる会話を提供するために広く使われている。
既存のほとんどのメソッドは、モデルの決定を覆す入力への最小の変更を求めます。
しかし、意思決定者は予測されたラベルだけでなく、信頼のしきい値やリスクマージンにも依存することが多い。
決定境界をほとんど越えないカウンターファクトは、ノイズやモデルの変化の下で脆弱で不安定である。
本稿では,TRUST(Target-confidence Recourse Using tSeTlin Machine)を提案する。
反事実を生成し、その後に信頼性を評価する代わりに、TRUSTは、ユーザ定義の信頼性目標を満たす最小限の変更を直接検索し、コスト、信頼性、堅牢性の観点からのリコメンデーションオプションの比較を可能にする。
確率的Tsetlin Machine (PTM) とベイズ最適化を組み合わせたTRUSTのインスタンス化を行う。
PTMの確率的節ベース構造は、予測信頼度と決定規則の安定性をリンクする。
同じルールを満足する反事実は、それらのルールをいかに確実に満たすかによって、信頼性に大きく違いがあることを示し、決定が堅牢か脆弱な節のアクティベーションによって支持されるかを明らかにする。
合成および実世界のデータセットの実験は、従来の境界に基づくアプローチよりも、目標信頼の反事実がより堅牢で解釈可能な会話を生み出すことを示した。
複数のベンチマークにおいて、TRUSTは、ハーバーマンデータセット上のL2距離0.10の信頼性を含む低いリコースコストを維持しながら、完全な堅牢性を達成する。
信頼を明示的に制御し、規則レベルの安定性を露呈することで、TRUSTは高い意思決定支援のための実行可能なレコースを提供する。
関連論文リスト
- Confidence-Aware Alignment Makes Reasoning LLMs More Reliable [65.44962502963378]
CASPOは、トークンレベルの信頼度とステップワイドな論理的正しさを、個別の報酬モデルをトレーニングせずに整合させるフレームワークである。
推論中、信頼を意識した思考(CaT)を提案し、不確実な推論枝を無視可能なO(V)レイテンシで動的に生成する。
10のベンチマークと複数のモデルファミリでの実験では、CASPOは推論の信頼性と推論効率を一貫して改善している。
論文 参考訳(メタデータ) (2026-05-08T07:08:25Z) - BAS: A Decision-Theoretic Approach to Evaluating Large Language Model Confidence [22.382291859991472]
本稿では,大言語モデルが抑止力を考慮した意思決定を支援するかを評価するための決定論的指標である行動アライメントスコア(BAS)を紹介する。
BASは、明示的な回答または持続可能なユーティリティモデルから派生し、リスク閾値の連続体にわたって実現されたユーティリティを集約する。
理論的には、真理信頼度推定は期待されるBASユーティリティを一意に最大化し、キャリブレーションと決定-最適行動のリンクを示す。
論文 参考訳(メタデータ) (2026-04-03T17:44:32Z) - Confidence Before Answering: A Paradigm Shift for Efficient LLM Uncertainty Estimation [47.91529693614168]
既存の方法は、主に回答ファーストであり、回答を生成した後のみ信頼を生み出す。
モデルが答える前に信頼を出力する信頼第一パラダイムについて検討し、このスコアを正解する確率として解釈する。
我々は,信頼度校正と正解精度をセグメント化された信用代入を通じて協調的に最適化する強化学習フレームワークであるCoCAを提案する。
論文 参考訳(メタデータ) (2026-03-06T04:03:13Z) - A Confidence-Variance Theory for Pseudo-Label Selection in Semi-Supervised Learning [15.149171763610662]
本稿では,疑似ラベル選択のための基本的共同信頼性基準を提供する信頼分散(CoVar)理論フレームワークを提案する。
信頼性の高い擬似ラベルは高いMCと低いRCVの両方を持つべきであり,信頼性が向上するにつれてRCVの影響が増大することを示す。
我々は,CoVarをプラグインモジュールとして,半教師付きセマンティックセマンティックセグメンテーションや画像分類手法に統合する。
論文 参考訳(メタデータ) (2026-01-16T02:51:59Z) - ConfTuner: Training Large Language Models to Express Their Confidence Verbally [58.63318088243125]
大規模言語モデル(LLM)は、科学、法律、医療といった高度な領域にますます展開されている。
LLMは、しばしば「過信」(overconfidence)として知られる、高い信頼で誤った答えを生成するために観察される。
論文 参考訳(メタデータ) (2025-08-26T09:25:32Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Human-Aligned Calibration for AI-Assisted Decision Making [19.767213234234855]
信頼度値が、意思決定者の予測に対する信頼度に関して自然な整合性を満たすならば、常に最適な意思決定方針が存在することを示す。
意思決定者自身の予測に対する自信に対するマルチキャリブレーションは、アライメントに十分な条件であることを示す。
論文 参考訳(メタデータ) (2023-05-31T18:00:14Z) - Fast Entropy-Based Methods of Word-Level Confidence Estimation for
End-To-End Automatic Speech Recognition [86.21889574126878]
本研究では,フレーム単位のエントロピー値を正規化して集約し,単位単位当たりの信頼度と単語毎の信頼度を求める方法を示す。
提案手法をLibriSpeechテストセット上で評価した結果,最大フレーム当たりの信頼度推定値の最大値から,信頼度推定値の最大値の最大値の最大値の最大値の最大値の2倍,4倍の精度を示した。
論文 参考訳(メタデータ) (2022-12-16T20:27:40Z) - Adversarial Training with Rectified Rejection [114.83821848791206]
本稿では,信頼度(T-Con)を確実性オラクルとして利用し,信頼度を補正してT-Conを予測することを提案する。
軽度の条件下では、正当性(R-Con)拒絶器と信頼性(R-Con)拒絶器を結合して、不正に分類された入力と正しく分類された入力を区別できることを示す。
論文 参考訳(メタデータ) (2021-05-31T08:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。