論文の概要: SR4-Fit: An Interpretable and Informative Classification Algorithm Applied to Prediction of U.S. House of Representatives Elections
- arxiv url: http://arxiv.org/abs/2602.06229v1
- Date: Thu, 05 Feb 2026 22:18:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.130224
- Title: SR4-Fit: An Interpretable and Informative Classification Algorithm Applied to Prediction of U.S. House of Representatives Elections
- Title(参考訳): SR4-Fit:米国下院議員選挙の予測に応用された解釈的・情報的分類アルゴリズム
- Authors: Shyam Sundar Murali Krishnan, Dean Frederick Hougen,
- Abstract要約: SR4-Fitは、前例のない精度と解釈可能性で下院選挙結果を予測することができることを示す。
また、乳がん、エコリ、ページブロック、ピマ・インディアン、自動車、酵母のデータセットなど、新たに利用可能な6つの分類データセットにも適用しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growth of machine learning demands interpretable models for critical applications, yet most high-performing models are ``black-box'' systems that obscure input-output relationships, while traditional rule-based algorithms like RuleFit suffer from a lack of predictive power and instability despite their simplicity. This motivated our development of Sparse Relaxed Regularized Regression Rule-Fit (SR4-Fit), a novel interpretable classification algorithm that addresses these limitations while maintaining superior classification performance. Using demographic characteristics of U.S. congressional districts from the Census Bureau's American Community Survey, we demonstrate that SR4-Fit can predict House election party outcomes with unprecedented accuracy and interpretability. Our results show that while the majority party remains the strongest predictor, SR4-Fit has revealed intrinsic combinations of demographic factors that affect prediction outcomes that were unable to be interpreted in black-box algorithms such as random forests. The SR4-Fit algorithm surpasses both black-box models and existing interpretable rule-based algorithms such as RuleFit with respect to accuracy, simplicity, and robustness, generating stable and interpretable rule sets while maintaining superior predictive performance, thus addressing the traditional trade-off between model interpretability and predictive capability in electoral forecasting. To further validate SR4-Fit's performance, we also apply it to six additional publicly available classification datasets, like the breast cancer, Ecoli, page blocks, Pima Indians, vehicle, and yeast datasets, and find similar results.
- Abstract(参考訳): 機械学習の成長は、重要なアプリケーションに対する解釈可能なモデルを必要とするが、ほとんどのハイパフォーマンスモデルは、入力と出力の関係を曖昧にする 'black-box'' システムである。
これにより、より優れた分類性能を維持しつつ、これらの制限に対処する新しい解釈可能な分類アルゴリズムであるSparse Relaxed Regularized Regression Rule-Fit (SR4-Fit)の開発が動機となった。
国勢調査局アメリカン・コミュニティ・サーベイのアメリカ合衆国議会選挙区の人口統計特性を用いて、SR4-Fitが下院選挙の結果を前例のない精度と解釈可能性で予測できることを実証した。
以上の結果から,多数派は依然として最強の予測者でありながら,ランダムな森林などのブラックボックスアルゴリズムでは解釈できない予測結果に影響を及ぼす階層的要因の内在的な組み合わせが明らかとなった。
SR4-Fitアルゴリズムは、精度、単純性、堅牢性に関してルールファイトのような既存の解釈可能なルールベースアルゴリズムとブラックボックスモデルの両方を超越し、優れた予測性能を維持しながら安定かつ解釈可能なルールセットを生成し、選挙予測におけるモデル解釈可能性と予測能力の間の伝統的なトレードオフに対処する。
SR4-Fitのパフォーマンスをさらに検証するため、乳がん、エコリ、ページブロック、ピマ・インディアン、車、酵母のデータセットなど、さらに6つのパブリックな分類データセットに適用し、同様の結果を得る。
関連論文リスト
- Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - The Surprising Effectiveness of Membership Inference with Simple N-Gram Coverage [71.8564105095189]
対象モデルからのテキスト出力のみに依存する会員推論攻撃であるN-Gram Coverage Attackを導入する。
我々はまず、N-Gram Coverage Attackが他のブラックボックスメソッドより優れている、様々な既存のベンチマークを実証する。
GPT-4oのような最近のモデルでは、メンバーシップ推論に対するロバスト性が向上していることがわかった。
論文 参考訳(メタデータ) (2025-08-13T08:35:16Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Self-Consistent Reasoning-based Aspect-Sentiment Quad Prediction with Extract-Then-Assign Strategy [17.477542644785483]
自己整合性推論に基づくアスペクト知覚四重項予測(SCRAP)を提案する。
SCRAPはそのモデルを最適化し、推論とそれに対応する感情四重項を順番に生成する。
最終的に、SCRAPは、複雑な推論タスクを処理し、一貫性投票によって四重項を正確に予測するモデルの能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-01T08:34:02Z) - Regression Trees for Fast and Adaptive Prediction Intervals [2.6763498831034043]
本稿では,局所的なカバレッジ保証を伴う回帰問題に対して,予測間隔を調整するための一連の手法を提案する。
回帰木とランダムフォレストを適合度スコアでトレーニングすることで分割を作成する。
提案手法は多種多様な適合性スコアや予測設定に適用できるため,多種多様である。
論文 参考訳(メタデータ) (2024-02-12T01:17:09Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Conformal Prediction for Deep Classifier via Label Ranking [29.784336674173616]
コンフォーマル予測(Conformal prediction)は、予測セットを所望のカバレッジ保証で生成する統計フレームワークである。
我々は、$textitSorted Adaptive Prediction Sets$ (SAPS)という新しいアルゴリズムを提案する。
SAPSは最大ソフトマックス確率を除いて全ての確率値を捨てる。
論文 参考訳(メタデータ) (2023-10-10T08:54:14Z) - Interpretable Random Forests via Rule Extraction [0.0]
本稿では,ルールの短時間かつ単純なリストの形式を取り入れた,安定なルール学習アルゴリズムであるSIRUSを紹介する。
当社のR/C++ソフトウェア実装サイラスは、CRANから入手可能です。
論文 参考訳(メタデータ) (2020-04-29T08:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。