論文の概要: Data-Aware and Scalable Sensitivity Analysis for Decision Tree Ensembles
- arxiv url: http://arxiv.org/abs/2602.07453v1
- Date: Sat, 07 Feb 2026 09:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.631051
- Title: Data-Aware and Scalable Sensitivity Analysis for Decision Tree Ensembles
- Title(参考訳): 決定木アンサンブルのためのデータ認識とスケーラブル感度解析
- Authors: Namrita Varshney, Ashutosh Gupta, Arhaan Ahmad, Tanay V. Tayal, S. Akshay,
- Abstract要約: 本稿では、データセットに近づき続けるために、センシティブなサンプルを制約するデータ認識型センシティブなフレームワークを提案する。
また,MILP(Mixed-Integer linear programming)とSMT(Satisfiability modulo theory)を組み合わせたデータ認識検索手法を開発した。
このフレームワークは、高精細なアプリケーションにおけるツリーベースモデルの信頼性と公平性を分析するための実践的な基盤を提供する。
- 参考スコア(独自算出の注目度): 4.7765262835100755
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Decision tree ensembles are widely used in critical domains, making robustness and sensitivity analysis essential to their trustworthiness. We study the feature sensitivity problem, which asks whether an ensemble is sensitive to a specified subset of features -- such as protected attributes -- whose manipulation can alter model predictions. Existing approaches often yield examples of sensitivity that lie far from the training distribution, limiting their interpretability and practical value. We propose a data-aware sensitivity framework that constrains the sensitive examples to remain close to the dataset, thereby producing realistic and interpretable evidence of model weaknesses. To this end, we develop novel techniques for data-aware search using a combination of mixed-integer linear programming (MILP) and satisfiability modulo theories (SMT) encodings. Our contributions are fourfold. First, we strengthen the NP-hardness result for sensitivity verification, showing it holds even for trees of depth 1. Second, we develop MILP-optimizations that significantly speed up sensitivity verification for single ensembles and for the first time can also handle multiclass tree ensembles. Third, we introduce a data-aware framework generating realistic examples close to the training distribution. Finally, we conduct an extensive experimental evaluation on large tree ensembles, demonstrating scalability to ensembles with up to 800 trees of depth 8, achieving substantial improvements over the state of the art. This framework provides a practical foundation for analyzing the reliability and fairness of tree-based models in high-stakes applications.
- Abstract(参考訳): 決定木アンサンブルは重要な領域で広く使われており、信頼性に欠かせない頑丈さと感度分析が重要である。
モデル予測を操作可能な,特定の機能のサブセット – 保護属性など – にアンサンブルが敏感かどうかを問う,機能感度の問題について検討する。
既存のアプローチはしばしば、トレーニング分布から遠く離れた感度の例を生み出し、解釈可能性と実践的価値を制限します。
本稿では,データセットに近接する機密事例を制約し,モデル弱点の現実的かつ解釈可能な証拠を生成するデータ認識感度フレームワークを提案する。
そこで本研究では,MILP(Mixed-Integer linear programming)とSMT(Satisfiability modulo theory)を組み合わせたデータ認識検索手法を開発した。
私たちの貢献は4倍です。
まず、感度検証のためのNP硬度結果を強化し、深さ1の木でも保持することを示す。
第二に、単一アンサンブルに対する感度検証を著しく高速化するMILP最適化を開発し、初めてマルチクラスツリーアンサンブルを処理できる。
第3に,トレーニング分布に近い実例を生成するデータ認識フレームワークを提案する。
最後に,大木アンサンブルを広範囲に評価し,800本以上の深さを持つアンサンブルに拡張性を示す。
このフレームワークは、高精細なアプリケーションにおけるツリーベースモデルの信頼性と公平性を分析するための実践的な基盤を提供する。
関連論文リスト
- UbiQTree: Uncertainty Quantification in XAI with Tree Ensembles [42.37986459997699]
そこで本研究では,SHAP値の不確かさを動脈,てんかん,結束成分に分解する手法を提案する。
本手法は実世界の3つのユースケースにまたがって記述的統計解析を用いて検証する。
この理解は、堅牢な意思決定プロセスの開発と、高度なアプリケーションにおけるモデルの改良を導くことができる。
論文 参考訳(メタデータ) (2025-08-13T09:20:33Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Enhancing Systematic Decompositional Natural Language Inference Using Informal Logic [51.967603572656266]
我々は,分解包含を注釈付けするための一貫した理論的なアプローチを導入する。
我々の新しいデータセットRDTEは、前回の分解エンターメントデータセットよりもかなり高い内部整合性(+9%)を持つことがわかった。
また,RDTE による知識蒸留によるエンテーメント分類器の訓練や,エンテーメントツリー推論エンジンへの導入により,精度と検証精度が向上することが確認された。
論文 参考訳(メタデータ) (2024-02-22T18:55:17Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Sensitivity-Aware Amortized Bayesian Inference [8.753065246797561]
感度分析は、様々なモデリング選択が統計的分析の結果に与える影響を明らかにする。
ニューラルネットワークを用いたシミュレーションベース推論に感度解析を統合するための多面的アプローチである感性認識型ベイズ推論(SA-ABI)を提案する。
本稿では,本手法が病気発生のダイナミクスや地球温暖化のしきい値から人的意思決定に至るまで,応用モデリング問題における有効性を示す。
論文 参考訳(メタデータ) (2023-10-17T10:14:10Z) - On the Robustness of Aspect-based Sentiment Analysis: Rethinking Model,
Data, and Training [109.9218185711916]
アスペクトベースの感情分析(ABSA)は、ソーシャルメディアのテキストやレビューの背後にある製品やサービスの特定の側面に対して、特定の感情の極性を自動的に推測することを目的としている。
我々は、モデル、データ、トレーニングを含むあらゆる可能な角度からボトルネックを体系的に再考することで、ABSAの堅牢性を高めることを提案する。
論文 参考訳(メタデータ) (2023-04-19T11:07:43Z) - Balancing Robustness and Sensitivity using Feature Contrastive Learning [95.86909855412601]
堅牢性を促進する方法は、希少なパターンや表現不足パターンに対するモデルの感受性を損なう可能性がある。
本稿では,より高次文脈的有用性を持つ機能に対して,モデルにより敏感な特徴を与える機能コントラスト学習(FCL)を提案する。
論文 参考訳(メタデータ) (2021-05-19T20:53:02Z) - Comparative Code Structure Analysis using Deep Learning for Performance
Prediction [18.226950022938954]
本稿では,アプリケーションの静的情報(抽象構文木やASTなど)を用いてコード構造の変化に基づいて性能変化を予測することの実現可能性を評価することを目的とする。
組込み学習手法の評価により,木系長短メモリ(LSTM)モデルでは,ソースコードの階層構造を利用して遅延表現を発見し,最大84%(個人的問題)と73%(複数の問題を含む組み合わせデータセット)の精度で性能変化を予測できることが示された。
論文 参考訳(メタデータ) (2021-02-12T16:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。