論文の概要: Locally Pareto-Optimal Interpretations for Black-Box Machine Learning Models
- arxiv url: http://arxiv.org/abs/2508.15220v1
- Date: Thu, 21 Aug 2025 04:11:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.1769
- Title: Locally Pareto-Optimal Interpretations for Black-Box Machine Learning Models
- Title(参考訳): ブラックボックス機械学習モデルに対する局所的パレート最適解釈
- Authors: Aniruddha Joshi, Supratik Chakraborty, S Akshay, Shetal Shah, Hazem Torfah, Sanjit Seshia,
- Abstract要約: 我々は,局所最適性保証に基づくフレームワークを開発し,解釈のスケーラブルな合成を実現する。
提案手法は,グローバルな保証を提供する手法によって合成された手法と密接に一致する解釈を導出することを示す。
- 参考スコア(独自算出の注目度): 0.8906214436849201
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating meaningful interpretations for black-box machine learning models involves balancing two often conflicting objectives: accuracy and explainability. Exploring the trade-off between these objectives is essential for developing trustworthy interpretations. While many techniques for multi-objective interpretation synthesis have been developed, they typically lack formal guarantees on the Pareto-optimality of the results. Methods that do provide such guarantees, on the other hand, often face severe scalability limitations when exploring the Pareto-optimal space. To address this, we develop a framework based on local optimality guarantees that enables more scalable synthesis of interpretations. Specifically, we consider the problem of synthesizing a set of Pareto-optimal interpretations with local optimality guarantees, within the immediate neighborhood of each solution. Our approach begins with a multi-objective learning or search technique, such as Multi-Objective Monte Carlo Tree Search, to generate a best-effort set of Pareto-optimal candidates with respect to accuracy and explainability. We then verify local optimality for each candidate as a Boolean satisfiability problem, which we solve using a SAT solver. We demonstrate the efficacy of our approach on a set of benchmarks, comparing it against previous methods for exploring the Pareto-optimal front of interpretations. In particular, we show that our approach yields interpretations that closely match those synthesized by methods offering global guarantees.
- Abstract(参考訳): ブラックボックス機械学習モデルの意味のある解釈を作成するには、しばしば矛盾する2つの目標、すなわち正確性と説明可能性のバランスが伴う。
これらの目的間のトレードオフを探求することは、信頼できる解釈を開発する上で不可欠である。
多目的解釈合成のための多くの技術が開発されているが、通常は結果のパレート最適性に関する正式な保証を欠いている。
このような保証を提供する手法は、パレート・最適空間を探索する際に、しばしば厳しいスケーラビリティの制限に直面します。
そこで我々は,よりスケーラブルな解釈合成を可能にする,局所最適性保証に基づくフレームワークを開発した。
具体的には、各解の直近近傍において、局所最適性保証を伴うパレート最適解釈の集合を合成する問題を考察する。
提案手法は,多目的モンテカルロ木探索のような多目的学習や探索技術から始まり,精度と説明可能性に関して,最適候補の最適セットを生成する。
次に、各候補の局所最適性をブール充足可能性問題として検証し、SATソルバを用いて解く。
提案手法の有効性を,従来のPareto-optimal front of interpretationを探索する手法と比較し,一連のベンチマークで検証した。
特に,本手法は,グローバルな保証を提供する手法によって合成された手法と密に一致した解釈を導出することを示す。
関連論文リスト
- Bounded Rationality for LLMs: Satisficing Alignment at Inference-Time [52.230936493691985]
本稿では,2次基準のしきい値に基づく制約を満たしつつ,主目的を最大化し,アライメントの多面性に対処する推論フレームワークSITAlignを提案する。
我々は、満足度に基づく推論アライメントアプローチの準最適境界を導出することで理論的洞察を提供する。
論文 参考訳(メタデータ) (2025-05-29T17:56:05Z) - Efficient First-Order Optimization on the Pareto Set for Multi-Objective Learning under Preference Guidance [41.24995294376129]
ユーザ特定嗜好下での多目的学習は、公正な条件下での多言語音声認識のような実世界の問題で一般的である。
我々は,事前定義された選好関数の最適化を目標とする半ベクタリアル二段階最適化問題として,そのような問題をモデル化する。
修正された単一レベル問題を解くアルゴリズムを提案し,その収束保証を確立する。
論文 参考訳(メタデータ) (2025-03-26T16:41:07Z) - Feature-Based Interpretable Surrogates for Optimization [0.8437187555622164]
本研究では、より一般的な最適化ルールを用いて解釈可能性を高める方法について検討する。
提案したルールは、具体的な解ではなく、共通の特徴を特徴とする解の集合にマップされる。
特に,提案手法が提案するソリューションの品質向上を,既存の解釈可能な最適化サロゲートと比較して実証する。
論文 参考訳(メタデータ) (2024-09-03T13:12:49Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Synergies between Disentanglement and Sparsity: Generalization and
Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。
この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:02:09Z) - Bi-objective Ranking and Selection Using Stochastic Kriging [0.0]
両目的のランク付けと選択の問題について検討し,その2つの目的が不確実性をもって観測された。
そこで本研究では,競合する解に対して逐次サンプルを割り当てるバイーシアン双対象ランクと選別法を提案する。
実験結果から,提案手法は標準的なアロケーション手法よりも優れており,また,よく知られた最先端のアルゴリズムも優れていることがわかった。
論文 参考訳(メタデータ) (2022-09-05T23:51:07Z) - Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - Synthesizing Pareto-Optimal Interpretations for Black-Box Models [7.345977965095031]
本稿では,解釈を合成するための多目的最適化手法を提案する。
本研究では, 定量的制約解の削減により, 基礎となる多目的最適化問題を解くことができることを示す。
我々の実験は、しばしば既存のアプローチで見逃される解釈に対して、豊かで多様な選択のセットが存在することを示している。
論文 参考訳(メタデータ) (2021-08-16T18:33:16Z) - Preference learning along multiple criteria: A game-theoretic
perspective [97.94912276610002]
我々は、ブラックウェルの接近性からインスピレーションを得て、フォン・ノイマンの勝者の概念をマルチ基準設定に一般化する。
本フレームワークは,基準間の選好の非線形集約を可能にし,多目的最適化から線形化に基づくアプローチを一般化する。
凸最適化問題の解法として,マルチ基準問題インスタンスのブラックウェルの勝者が計算可能であることを示す。
論文 参考訳(メタデータ) (2021-05-05T03:23:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。