論文の概要: Learning High-Order Interactions via Targeted Pattern Search
- arxiv url: http://arxiv.org/abs/2102.12974v1
- Date: Tue, 23 Feb 2021 11:13:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 13:46:42.159669
- Title: Learning High-Order Interactions via Targeted Pattern Search
- Title(参考訳): ターゲットパターン検索による高次インタラクションの学習
- Authors: Michela C. Massi, Nicola R. Franco, Francesca Ieva, Andrea Manzoni,
Anna Maria Paganoni, Paolo Zunino
- Abstract要約: ターゲットパターン探索(LIPS)による高次インタラクションの学習という新しいアルゴリズムを提案する。
LIPSは、ロジスティック回帰モデルに含まれる様々な順序の相互作用項を選択する。
実際の研究シナリオに広く適用できることを証明し、ベンチマークの最先端のアルゴリズムを上回っていることを示しています。
- 参考スコア(独自算出の注目度): 0.6198237241838558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Logistic Regression (LR) is a widely used statistical method in empirical
binary classification studies. However, real-life scenarios oftentimes share
complexities that prevent from the use of the as-is LR model, and instead
highlight the need to include high-order interactions to capture data
variability. This becomes even more challenging because of: (i) datasets
growing wider, with more and more variables; (ii) studies being typically
conducted in strongly imbalanced settings; (iii) samples going from very large
to extremely small; (iv) the need of providing both predictive models and
interpretable results. In this paper we present a novel algorithm, Learning
high-order Interactions via targeted Pattern Search (LIPS), to select
interaction terms of varying order to include in a LR model for an imbalanced
binary classification task when input data are categorical. LIPS's rationale
stems from the duality between item sets and categorical interactions. The
algorithm relies on an interaction learning step based on a well-known frequent
item set mining algorithm, and a novel dissimilarity-based interaction
selection step that allows the user to specify the number of interactions to be
included in the LR model. In addition, we particularize two variants (Scores
LIPS and Clusters LIPS), that can address even more specific needs. Through a
set of experiments we validate our algorithm and prove its wide applicability
to real-life research scenarios, showing that it outperforms a benchmark
state-of-the-art algorithm.
- Abstract(参考訳): ロジスティック回帰(英: Logistic Regression、LR)は、経験的二項分類研究において広く用いられる統計的手法である。
しかし、現実のシナリオは、しばしば、as-is LRモデルの使用を妨げる複雑さを共有し、代わりにデータのばらつきを捉えるために高次相互作用を含める必要性を強調します。
これはさらに難しくなる: (i) データセットがますます多くの変数で拡大する; (ii) 一般的に強く不均衡な設定で実行される; (iii) サンプルが非常に大きいから非常に小さい; (iv) 予測モデルと解釈可能な結果の両方を提供する必要性。
本稿では,ターゲットパターン探索(LIPS)による高次相互作用の学習アルゴリズムを提案する。入力データが分類された場合に,不均衡な二項分類タスクに対するLRモデルに含まれる様々な順序の相互作用条件を選択する。
LIPSの論理は、アイテムセットとカテゴリー的相互作用の双対性に由来する。
このアルゴリズムは、よく知られた頻繁なアイテムセットマイニングアルゴリズムに基づくインタラクション学習ステップと、ユーザがLRモデルに含まれるインタラクションの数を指定することのできる、新しい異種性に基づくインタラクション選択ステップに依存している。
さらに、より具体的なニーズに対処できる2つの変種(Scores LIPSとClusters LIPS)を特化しています。
一連の実験を通じて,本アルゴリズムの妥当性を検証し,実生活研究シナリオに適用可能であることを証明した。
関連論文リスト
- Collaborative Learning with Different Labeling Functions [8.53926206853583]
我々は、$n$のデータ分布ごとに正確な分類器を学習することを目的とした、協調型PAC学習の亜種について研究する。
データ分布がより弱い実現可能性の仮定を満たす場合、サンプル効率の学習は依然として可能であることを示す。
論文 参考訳(メタデータ) (2024-02-16T04:32:22Z) - Sample-Efficient Clustering and Conquer Procedures for Parallel
Large-Scale Ranking and Selection [0.0]
並列コンピューティング環境では、相関ベースのクラスタリングは$mathcalO(p)$サンプル複雑性低減率を達成することができる。
ニューラルアーキテクチャ検索のような大規模AIアプリケーションでは、スクリーニングなしバージョンの手順が、サンプル効率の点で完全に順序づけられたベンチマークを驚くほど上回っている。
論文 参考訳(メタデータ) (2024-02-03T15:56:03Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - RGM: A Robust Generalist Matching Model [53.223624323416914]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Improved Robust Algorithms for Learning with Discriminative Feature
Feedback [21.58493386054356]
識別的特徴フィードバック(英: Discriminative Feature Feedback)は、人間の教師によって提供される特徴説明に基づく対話型学習のためのプロトコルである。
我々は、識別的特徴フィードバックモデルのための、新しい堅牢な対話型学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-09-08T12:11:12Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - pRSL: Interpretable Multi-label Stacking by Learning Probabilistic Rules [0.0]
本稿では,確率論的命題論理則と信念伝播を用いた確率論的ルールスタックリング(pRSL)を提案し,その基礎となる分類器の予測と組み合わせる。
精度と近似推論と学習のためのアルゴリズムを導出し、様々なベンチマークデータセット上でpRSLが最先端の性能に達することを示す。
論文 参考訳(メタデータ) (2021-05-28T14:06:21Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。