論文の概要: When Interpretability Is Unequally Distributed: Fairness in Hybrid Interpretable Models
- arxiv url: http://arxiv.org/abs/2605.28626v1
- Date: Wed, 27 May 2026 15:33:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.179669
- Title: When Interpretability Is Unequally Distributed: Fairness in Hybrid Interpretable Models
- Title(参考訳): 解釈可能性が不等分散であるとき--ハイブリッド解釈モデルにおける公正性
- Authors: Ziba Jabbar Zare, Ulrich Aïvodji, Julien Ferry, Thibaut Vidal,
- Abstract要約: ハイブリッド解釈可能なモデルは、いくつかの例を前者に割り当て、残りを後者に延期することで、透明なコンポーネントとブラックボックスモデルを組み合わせる。
一部の集団は体系的に解釈可能な決定を受け、他の集団は不均等にブラックボックスにルーティングされる。
我々は,この問題を,ハイブリッドな解釈可能なモデルのルーティング決定に適用される,階層的・階層的尺度であるInterpretability Coverage Disparity (ICD) として定式化する。
- 参考スコア(独自算出の注目度): 7.412725493312841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hybrid interpretable models combine a transparent component with a black-box model by assigning some examples to the former and deferring the rest to the latter. While this design enables flexible tradeoffs between accuracy and interpretability, it also raises a distinct procedural fairness concern: some demographic groups may systematically receive interpretable decisions, while others are disproportionately routed to a black box. We formalize this issue as Interpretability Coverage Disparity (ICD), a demographic-parity-style measure applied to the routing decision of hybrid interpretable models. Using tools from predictive multiplicity, we study ICD across four hybrid interpretable learning methods, three standard fairness benchmark datasets, and multiple sensitive attributes. Our experiments reveal substantial ICD in intermediate transparency regimes, where both the interpretable and black-box components are actively used. We further show that simple coverage-disparity constraints can significantly reduce ICD in exact hybrid learning methods, with marginal impact on accuracy and sparsity. In several settings, ICD mitigation also improves standard algorithmic fairness metrics. These results show that hybrid interpretable models should be audited not only for predictive fairness, but also for how they allocate interpretability across individuals and groups.
- Abstract(参考訳): ハイブリッド解釈可能なモデルは、いくつかの例を前者に割り当て、残りを後者に延期することで、透明なコンポーネントとブラックボックスモデルを組み合わせる。
この設計は正確性と解釈可能性の間の柔軟なトレードオフを可能にするが、手続き的公正性に関する懸念も生じている: 一部の人口集団は体系的に解釈可能な決定を受け、他の集団は不均等にブラックボックスにルーティングされる。
我々は,この問題を,ハイブリッドな解釈可能なモデルのルーティング決定に適用される,階層的・階層的尺度であるInterpretability Coverage Disparity (ICD) として定式化する。
予測多重度から得られるツールを用いて、4つのハイブリッド解釈可能な学習方法、標準フェアネスベンチマークデータセット3つ、および複数の感度属性のICDについて検討した。
本実験は, 中間透明化機構において, 解釈可能成分とブラックボックス成分の両方を積極的に使用した重要なICDを明らかにした。
さらに、単純なカバレッジ差制約は、正確なハイブリッド学習手法におけるICDを著しく減少させ、精度とスパース性に限界を及ぼすことを示した。
いくつかの設定では、ICDの緩和は標準的なアルゴリズムの公正度指標も改善する。
これらの結果は、ハイブリッド解釈可能なモデルは、予測フェアネスだけでなく、個人やグループ間での解釈可能性の配分方法についても監査されるべきであることを示している。
関連論文リスト
- VAE-Inf: A statistically interpretable generative paradigm for imbalanced classification [8.677199689027772]
生成的モデリングと識別的分類のギャップを埋める2段階の枠組みを提案する。
推論のために、自然な仮説テストの解釈を受け入れるプロジェクションベースのスコアを導入する。
様々な実世界のベンチマークの実験は、我々のフレームワークが他のアプローチと競合する性能を達成していることを示している。
論文 参考訳(メタデータ) (2026-04-28T07:50:56Z) - MBD: A Model-Based Debiasing Framework Across User, Content, and Model Dimensions [50.00784452900918]
この課題に対処する一般モデルベースデバイアス(MBD)フレームワークを提案する。
任意のコホートに対するエンゲージメント分布の文脈平均と分散を明示的に推定する。
この統合により、フレームワークはバイアス付き生信号からバイアスなしの表現に変換することができる。
論文 参考訳(メタデータ) (2026-03-15T15:07:01Z) - CDRRM: Contrast-Driven Rubric Generation for Reliable and Interpretable Reward Modeling [61.75914342638658]
CDRRM(Contrast-Driven Reward Model)は、高品質なルーリック生成と優先判断のためのフレームワークである。
この作業は、報酬モデリングのためのスケーラブルで解釈可能で、データ効率のよいパスを提供する。
論文 参考訳(メタデータ) (2026-03-09T07:15:23Z) - On the use of graph models to achieve individual and group fairness [0.6299766708197883]
我々は、動的システムとホモロジーに基づくツールを活用して公平性をモデル化するための、せん断拡散に基づく理論的枠組みを提供する。
本稿では,異なる公平度尺度を扱うネットワークトポロジの集合について述べる。
本稿では,提案モデルの性能を,精度と公平性の観点から示す。
論文 参考訳(メタデータ) (2026-01-13T18:17:43Z) - Towards Fair In-Context Learning with Tabular Foundation Models [6.4989916051093815]
トランスフォーマーを用いたインコンテクスト学習(ICL)におけるフェアネスの最初の研究について述べる。
最近提案された3つの基盤モデル(TabPFNv2、TabICL、TabDPT)をベンチマークデータセットで評価した。
実験の結果、不確実性に基づく戦略は、予測精度に最小限の影響を伴って、グループフェアネスの指標を一貫して改善することが示された。
論文 参考訳(メタデータ) (2025-05-14T15:53:14Z) - Towards Cohesion-Fairness Harmony: Contrastive Regularization in
Individual Fair Graph Clustering [5.255750357176021]
iFairNMTFは、対照的なフェアネス正則化を持つ個別のフェアネス非負行列三要素化モデルである。
我々のモデルは、カスタマイズ可能な精度対公平トレードオフを可能にし、それによってユーザーの自律性を高める。
論文 参考訳(メタデータ) (2024-02-16T15:25:56Z) - DualFair: Fair Representation Learning at Both Group and Individual
Levels via Contrastive Self-supervision [73.80009454050858]
この研究は、DualFairと呼ばれる自己教師型モデルを提示し、学習された表現から性別や人種などのセンシティブな属性をデバイアスすることができる。
我々のモデルは、グループフェアネスと対実フェアネスという2つのフェアネス基準を共同で最適化する。
論文 参考訳(メタデータ) (2023-03-15T07:13:54Z) - Domain Adaptation meets Individual Fairness. And they get along [48.95808607591299]
アルゴリズムフェアネスの介入は、機械学習モデルが分散シフトを克服するのに役立つことを示す。
特に,個人フェアネス(IF)の適切な概念を強制することで,MLモデルの分布外精度が向上することを示す。
論文 参考訳(メタデータ) (2022-05-01T16:19:55Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。